구글이 새로운 비전언어모델(VLM) ‘PaliGemma 2’를 오픈 소스로 공개했습니다. 이 모델은 이미지 속 객체 식별을 넘어 감정, 동작, 장면의 서사까지 분석할 수 있는 고도화된 기능을 제공합니다. 주요 기능과 특징 1. 다양한 […]
by IY
구글이 새로운 비전언어모델(VLM) ‘PaliGemma 2’를 오픈 소스로 공개했습니다. 이 모델은 이미지 속 객체 식별을 넘어 감정, 동작, 장면의 서사까지 분석할 수 있는 고도화된 기능을 제공합니다. 주요 기능과 특징 1. 다양한 […]