본문 바로가기

최신기술

[038] 인간처럼 사고하는 멀티모달(Multi Modal) AI란 무엇인가?


모달리티(Modality)는 사전상 뜻이 ‘양식’ 또는 ‘양상’을 의미합니다. 즉 어떤 형태로 나타나는 현상이나 그것을 받아들이는 방식을 말합니다. 여기서 멀티모달(Multi Modal)이 의미하는 것은 여러 양상들을 말하는 것이며, 사람이 시각, 청각 등의 오감을 이용하여 사물에 대한 정보를 파악하고 받아들이는 것을 의미합니다.

인간이 사물의 양상을 다양한 감각기관으로 받아들이는 것처럼, 해당 역할이 가능한 여러 인터페이스를 통해 서로 다른 감각이나 유형의 정보를 컴퓨터가 학습하여, 사고할 수 있게 만든 AI를 멀티모달(Multi Modal) AI라고 합니다.

인간이 사과를 이해하는 방식은 다양해요. (출처: Intel Labs)

멀티모달 AI는 대표적으로 4가지의 분야로 나뉩니다.
멀티모달 AI 처리기술