"멀티모달"에 대한 통합검색 결과
통합검색(5)
정치(0)


'지브리풍 프사' 열풍…챗GPT 이용 역대 최다 챗GPT로 일본의 대표 애니메이션 제작사인 ‘지브리’풍 이미지를 생성하는 이용자 수가 급증했다. 1일 데이터 플랫폼 기업 아이지에이웍스의 모바일인덱스에 따르면 지난 달 27일 기준, 챗GPT 국내 일간 활성 이용자 수(DAU)는 125만2925명으로 역대 최다를 집계됐다. 앞서 지난 달 10일 챗GPT DAU는 103만3733명으로 처음으로 100만명대를 기록했다. 2주 만에 최다 기록을 경신한 것이다. 앞서 오픈AI는 지난 달 25일 신규 이미지 생성 AI 모델 '챗GPT-4o 이미지 생성'을 출시했다. 해당 모델이 공개된 이후, 전 세계의 챗GPT 이용자들이 디즈니, 심슨 가족 등 인기 애니메이션 화풍의 이미지를 생성해 SNS에 올렸다. 특히 '하울의 움직이는 성', '센과 치히로의 행방불명' 등 일본의 대표 애니메이션 제작사인 지브리의 화풍으로 만든 이미지가 인기다. 챗GPT 개발사 오픈AI의 샘 올트먼 최고경영자(CEO)도 자신의 X(엑스·옛 트위터) 프로필 사진을 지브리 화풍으로 올렸을 정도다. 해당 모델은 오픈AI의 멀티모달 AI 모델 '챗GPT-4o'와 결합한 이미지 생성 모델로, 명령어를 하나하나 입력할 필요 없이 이용자의 의도를 파악해 이미지를 생성한다. 다만 챗GPT를 활용한 이미지 생성이 급증하며 올트먼 CEO는 "그래픽처리장치(GPU)가 녹아내리고 있다"며 기술적 부작용을 우려하기도 했다. 여기에 더해 특정 콘텐츠 화풍으로 인한 저작권 침해 문제와 혐오 표현을 담은 콘텐츠 생성에 대해 우려하는 목소리도 있다.

2025.04.01

LG전자, 베어로보틱스 경영권 확보…로봇 사업 경쟁력 제고 LG전자(대표이사 조주완)가 AI 기반 상업용 자율주행로봇 기업 베어로보틱스(Bear Robotics)의 경영권 확보를 통해 미래 먹거리인 로봇 사업의 경쟁력을 제고한다. LG전자는 22일 이사회를 열고 베어로보틱스의 30% 지분을 추가 인수하는 콜옵션을 행사하기로 의결했다. 베어로보틱스는 2017년 美 실리콘벨리에서 설립된 AI 기반 상업용 자율주행로봇 기업이다. 로봇 소프트웨어(SW) 플랫폼 구축, 다수 로봇을 최적화한 경로로 움직이는 군집제어 기술, 클라우드 관제 솔루션 등 분야에 세계적 기술력을 보유하고 있다는 평가를 받는다. LG전자는 2024년 3월 6천만달러를 투자해 베어로보틱스 지분 21%를 취득하고, 최대 30% 지분을 추가 인수할 수 있는 콜옵션 계약을 맺었다. 콜옵션 행사가 완료되면 베어로보틱스 지분의 51%를 보유, 경영권을 확보하며 자회사로 편입하게 된다. 이를 통해 LG전자는 ‘클로이 로봇’ 중심의 상업용 로봇 사업 일체를 베어로보틱스와 통합한다. 하정우 CEO를 비롯한 베어로보틱스 주요 경영진은 유임해 기존 사업의 연속성을 확보하는 한편, LG전자에서도 이사회 멤버로 참여해 상업용 로봇 사업 시너지 창출에 매진한다. LG전자는 베어로보틱스를 통해 상업용 로봇 시장을 공략하는 동시에, 고객을 이해하는 공감지능(AI)과 가전사업을 이어가며 축적한 제조 역량을 기반으로 가정용∙산업용 로봇 사업도 강화한다. 먼저 가정용 로봇 분야는 업계 최고 수준의 생활가전 기술력을 갖춘 HS사업본부에서 총괄한다. 가정용 로봇이 공감지능을 통해 가족 구성원의 상태를 정교하게 인식하고, 이에 맞춰 가전제품과 서비스를 매끄럽게 연결하는 총체적인 경험을 제공하는 데 초점을 둔다. 연내 출시 예정인 이동형 AI홈 허브(프로젝트명: Q9)가 대표적이다. Q9은 두 다리에 달린 바퀴와 자율 주행 기술과 음성∙음향∙이미지 인식 등을 접목한 멀티모달(Multi Modal) 센싱을 통해 집안을 자유롭게 이동하며 사용자와 소통하고 집안의 가전과 IoT 기기를 유기적으로 연결∙제어하는 것은 물론 자연스럽게 고객과 대화하기 위해 마이크로소프트(MS)의 음성인식 및 음성합성 기술도 탑재했다. 지난해 말 덴마크 오덴세에서 열린 세계 최대규모 로봇 콘퍼런스 ‘로스콘 2024’에서는 Q9 개발자를 위해 SW 개발 키트를 공개하며 개방형 생태계를 조성하는 데에도 속도를 내고 있다. LG전자 CSO 이삼수 부사장은 “이번 추가 투자는 ‘명확한 미래’인 로봇을 신성장 동력으로 키우겠다는 LG전자의 확고한 의지에 따른 것”이라며 “상업용∙산업용∙가정용 등 로봇 사업 전방위 분야에서 지속적인 혁신을 이어나가겠다”고 말했다.

2025.01.24

삼성전자, '갤럭시 S25 시리즈' 공개…"역대 가장 쉽고 직관적"삼성전자가 22일(현지시간) 미국 새너제이에 위치한 SAP센터에서 '갤럭시 언팩 2025(Galaxy Unpacked 2025)' 행사를 개최해 '갤럭시 S25 시리즈'를 공개했다. 삼성전자 MX사업부장 노태문 사장은 "삼성전자는 지난해 세계 최초로 AI 스마트폰을 출시한 후 지속적인 혁신을 통해 모바일 AI 시장을 선도해 왔으며, 새롭게 출시되는 갤럭시 S25 시리즈는 한층 더 발전한 갤럭시 AI를 통해 역대 가장 쉽고 직관적인 AI 경험을 선보일 것"이라며, "갤럭시 S25 시리즈는 모바일 AI에 최적화된 플랫폼 'One UI 7'을 통해 사용자의 일상 자체를 혁신할 것"이라고 말했다. 갤럭시 S25 시리즈는 역대 갤럭시 최초로 통합형 AI 플랫폼인 'One UI 7'이 탑재돼 자연스럽고 직관적인 사용성을 제공한다. 텍스트, 음성, 이미지 등 다양한 사용자 접점에서 사용자의 상황을 이해하고 취향을 분석해 개인화된 AI 경험을 구현한다. 고도화된 자연어 이해 기술 기반으로 일상 속에서 사용자에게 더욱 자연스러운 모바일 경험을 제공한다. 새로운 '나우 브리프(Now Brief)' 기능은 사용자의 스마트폰 사용 패턴과 데이터를 분석해 개인화된 맞춤형 정보 브리핑을 제공한다. 해당 기능은 사용자에게 날씨, 일정, 나의 수면 점수 등 사용자에게 필요한 정보를 개인 비서처럼 알려준다. 갤럭시 S25 시리즈는 AI 에이전트와 텍스트, 이미지, 음성 등 다양한 유형의 정보를 동시에 분석하고 처리하는 멀티모달 AI를 탑재해, 사용자에게 쉽고 편리한 경험을 제공한다. 사용자가 여러가지 앱 실행이 필요한 복잡한 작업을 하는 경우, 갤럭시 S25 시리즈에 한 문장의 명령어를 입력하면 필요한 앱들이 연결되어 쉽게 실행된다. 사용자는 휴대폰 측면의 AI 버튼을 길게 눌러 친구와 대화하듯 자연스럽게 말로 명령어를 입력하고, 작업을 처리할 수 있다. 구글과의 협업으로 갤럭시 S24 시리즈에 처음 탑재됐던 '서클 투 서치(Circle to Search)' 기능도 진화했다. 다양한 데이터 형태를 처리할 수 있는 멀티모달이 적용돼 기존의 이미지, 텍스트 검색에 더해 기기에서 재생되는 사운드 검색도 지원한다. 사용자가 유튜브 영상의 음악이 궁금한 경우, 홈버튼을 눌러 서클 투 서치 기능을 실행하고 음악 검색을 하면 바로 곡명을 확인할 수 있다. 삼성전자와 구글은 지속적으로 함께 협업해 다양한 파트너사와 개발자들이 함께 할 수 있는 진정한 AI 에코시스템을 실현할 예정이다. 갤럭시 S25 시리즈는 언어와 표현의 장벽을 없애주는 커뮤니케이션 기능도 한층 업그레이드 됐다. 먼저, 통화 시 실시간으로 양방향 통역 서비스를 제공하는 '실시간 통역(Live Translate)' 기능은 20개 언어를 지원해 보다 많은 나라의 사람들과 자유로운 의사소통을 가능하게 한다. 또 통화 내용을 글로 옮겨주는 '텍스트 변환(Call Transcript)'과 통화 내용 중 중요한 사항을 간단하게 정리해 주는 '통화 요약(Call Summary)'을 새롭게 지원한다. 갤럭시 S25 시리즈에는 갤럭시 AI를 통해 발전한 새로운 '글쓰기 어시스트(Writing Assist)' 기능도 탑재됐다. 사용자는 텍스트 요약, 맞춤법과 문법 검사 등 생성형 AI 기반의 텍스트 편집 기능들을 통합한 '글쓰기 어시스트'를 통해 어느 화면에서든 쉽고 빠르게 텍스트 편집 기능을 사용할 수 있다. 새로운 갤럭시 S 시리즈는 삼성전자와 퀄컴이 협력해서 개발한 '갤럭시용 스냅드래곤 8 엘리트(Snapdragon® 8 Elite for Galaxy)'가 탑재됐다. 갤럭시 전용 칩셋 중 역대 가장 강력한 성능을 자랑하는 '갤럭시용 스냅드래곤 8 엘리트'는 전작인 '갤럭시용 스냅드래곤 8 3세대'와 비교해 NPU가 40%, CPU와 GPU 성능은 각각 37%, 30% 향상됐다. '갤럭시용 스냅드래곤 8 엘리트'는 디스플레이 품질과 효율성을 극대화하는 방향으로 설계됐다. 칩셋에 설계된 AI 기반의 이미지 프로세싱 알고리즘을 기반으로, 다양한 콘텐츠를 선명하게 표현해 주는 '프로스케일러(ProScaler)' 기능이 최초로 탑재돼 이미지 품질이 약 40% 이상 개선됐다. 삼성전자의 화질 개선 솔루션인 'mDNIe(Mobile Digital Natural Image)'를 내부에 탑재해 화질 및 시인성 개선 등은 물론 전력 효율도 향상됐다. 스마트폰 사용 시 더 오랜 시간 안정적인 성능을 유지할 수 있도록 방열 시스템도 진화했다. 갤럭시 S25 울트라의 경우 전작 대비 약 40% 커진 '베이퍼 챔버(Vapor Chamber)'가 탑재됐다. 또한, 갤럭시 S25 시리즈에 새로운 열전도소재(thermal interface material, TIM)를 사용한 효율적인 방열시스템을 적용됐다. 이를 통해 사용자는 더욱 오랜 시간 고성능의 모바일 경험을 할 수 있다. 또한, 갤럭시 S25 시리즈는 자연스럽고 실제와 같은 비주얼 그래픽을 제공하는 개선된 '레이 트레이싱(Ray tracing)'과 3D 그래픽용 응용 프로그램인 '벌컨(Vulkan)'을 지원해 보다 실감나고 안정적인 게이밍 경험을 제공한다. 갤럭시 S25 시리즈는 카메라 성능 역시 전작 대비 대폭 업그레이드됐다. 갤럭시 S25 시리즈는 고해상도 센서와 AI 기반의 차세대 '프로비주얼 엔진(ProVisual Engine)'을 탑재해 먼 거리에서도 디테일한 고화질의 이미지 촬영 경험을 제공한다. 갤럭시 S25 울트라는 새로운 5천만 화소 초광각 카메라가 적용돼 넓은 화각으로 촬영하는 풍경 사진 등에서 보다 훌륭한 고화질 촬영을 지원한다. 갤럭시 S 시리즈 카메라의 상징과도 같은 저조도 카메라 성능도 향상됐다. 갤럭시 S25 시리즈는 저조도 비디오 성능 향상 솔루션을 탑재해, 움직이는 피사체와 고정된 피사체를 보다 정교하게 분석한다. 이를 통해, 각 피사체에 최적의 노이즈 제거 솔루션을 적용해, 저조도 환경에서도 깨끗한 영상 촬영을 지원한다. 또한, 갤럭시 S25 시리즈는 비디오 모드에 10-bit HDR 옵션이 기본으로 적용돼 보다 풍부한 색감을 담을 수 있는 영상 촬영 기능을 제공한다. 전문가와 사진 애호가들을 위한 Expert RAW 앱에는 '가상 조리개(Virtual Aperture)' 기능이 추가됐다. 사용자는 이 기능을 통해, 전문가용 카메라와 같은 심도 표현을 할 수 있다. 갤럭시 S25 시리즈에서는 새로운 AI 영상 편집 기능도 추가됐다. '오디오 지우개(Audio Eraser)'는 촬영한 영상 속의 목소리, 주변 소리, 소음, 바람 소리 등 사운드를 AI가 분류해 주는 기능이다. 사용자는 분류된 사운드를 간단한 클릭만으로 제거하거나 음량을 조절해 더욱 전문적인 영상 편집을 할 수 있다. 삼성전자는 2월 7일부터 갤럭시 S25 시리즈를 국내 포함 전세계에 순차적으로 출시한다. 국내 사전 판매는 1월 24일부터 2월 3일까지 11일간 진행된다. 갤럭시 S25 울트라는 '티타늄 실버블루', '티타늄 블랙', '티타늄 화이트실버', '티타늄 그레이' 4종의 색상으로 출시된다. 갤럭시 S25+와 갤럭시 S25는 '실버 쉐도우', '네이비', '아이스블루', '민트' 4종의 색상으로 출시된다. 삼성닷컴과 '삼성 강남'에서만 구매가능한 전용 색상도 출시된다. 갤럭시 S25 울트라는 '티타늄 제트블랙', '티타늄 제이드그린', '티타늄 핑크골드' 3종이, 갤럭시 S25+와 갤럭시 S25는 '코랄레드', '블루블랙 ', '핑크골드' 3종이 단독 색상으로 출시된다. 갤럭시 S25 울트라는 12GB 메모리에 256GB, 512GB, 1TB 스토리지를 탑재한 모델이 기본으로 출시된다. 가격은 각각 169만 8,400원, 184만 1,400원, 212만 7,400원이다. 16GB 메모리에 1TB 스토리지를 탑재한 모델은 '티타늄 제트블랙' 색상 1종으로 삼성닷컴에서 자급제로 출시된다. 가격은 224만 9,500원이다. 갤럭시 S25+는 12GB 메모리에 256GB 스토리지를 탑재한 모델이 135만 3,000원, 512GB는 149만 6,000원이다. 갤럭시 S25는 12GB 메모리에 256GB 스토리지 모델이 115만 5,000원, 512GB는 129만 8,000원이다. 한편 이번 갤럭시 S25 시리즈 전 제품은 국내에서 전작과 같은 판매가로 가격이 책정됐다.

2025.01.23

SKT, AI영상분석 스타트업 ‘트웰브랩스’에 300만달러 투자SK텔레콤(대표이사CEO 유영상)이 글로벌 AI 시장에서 주목받고 있는 AI 영상분석 스타트업 ‘트웰브랩스(Twelve Labs)’에 300만 달러를 투자한다고 13일 밝혔다. 트웰브랩스는 영상을 이해하고 검색할 수 있는 멀티모달AI 모델을 개발하는 스타트업으로, 2021년 미국 샌프란시스코에 설립됐다. 올해 6월 엔비디아의 자회사 엔벤처스(NVentures)와 뉴엔터프라이즈어소시에이트(NEA) 등으로부터 약 5000만 달러 규모의 투자 유치에 성공하며 화제가 된 기업이다. 트웰브랩스는 우수한 AI 영상이해모델을 통해 영상 속에 다양한 사람과 사물을 식별하고 행동까지 파악한다. 이를 기반으로 영상검색 솔루션 ‘마렝고(Marengo)’와 영상에서 질의응답을 할 수 있는 솔루션 '페가수스(Pegasus)’를 제공하고 있다. 트웰브랩스는 글로벌 리서치기관 CB인사이트가 발표한 글로벌 100대 AI 스타트업 ‘AI100’에 2022년부터 2024년까지 3년 연속 선정될 정도로 글로벌 시장에서 주목받고 있다. SKT와 트웰브랩스는 양사가 보유한 AI 역량을 결합해 ‘AI 에이전트’와 같은 서비스 고도화를 통해 고객들에게 더욱 혁신적인 AI 경험을 제공할 수 있을 것으로 기대하고 있다. 가령 수만 개 영상 중에서 “아기가 첫 걸음마 떼는 영상 찾아줘”, “손흥민 선수와 김민재 선수가 패스하는 영상을 분류해서 보여줘”라던가 “이 영상에서 벌어지는 일을 텍스트로 정리해줘” 등의 검색을 수행하면, 원하는 장면을 정확하게 찾고 영상의 내용을 텍스트로 정리해 주는 식이다. 이 외에도 양사는 AI 관제시스템과 같은 보안과 공공 안전 분야에 멀티모달 AI적용을 위한 관련 기술개발 및 고도화에 힘을 모으기로 했다. AI 관제시스템의 경우 기존에는 한 명의 실무자가 장시간 수많은CCTV를 모니터링 해야 했던 것과 달리 트웰브랩스의 멀티모달AI모델을 적용하면 그 날 있었던 주요 사건, 움직임, 인물 등을 빠르게 검색 및 요약할 수 있다. CCTV 통합관제센터의 경우 악천후나 상대적으로 조건이 열악한 도로변, 어두운 골목길 등에 높은 수준의 실시간 탐지 및 검색 등 관제업무 효율성에 대한 니즈가 커지고 있어 멀티모달 AI활용 기회는 무궁무진할 것으로 기대하고 있다. 아울러 트웰브랩스는 SKT가 주도하는 ‘K-AI 얼라이언스’에도 합류해 멤버사들과 다양한 시너지 프로젝트를 추진하는 등 AI 생태계 활성화에도 힘을 모으기로 했다. 글로벌 AI 기업들은 텍스트를 넘어 영상, 음성, 이미지 등 다양한 형태의 데이터를 분석하고 생성할 수 있는 이른바 멀티모달(Multimodal) 기술에 투자와 연구를 진행하고 있다. 실제 글로벌 시장조사업체 ‘모도인텔리전스’는 AI 영상 분석 시장 규모가 2028년 753억5000만달러에 달할 것으로 전망했다. 트웰브랩스의 이재성 대표는 “SK텔레콤과의 협력으로 트웰브랩스의 영상이해기술이 더 많은 산업 현장에 혁신적인 영상이해 AI 솔루션을 제공할 수 있을 것으로 기대된다“고 밝혔다. SKT의 이재신 AI성장전략본부장은 “양사 협력을 통해 멀티모달 AI 분야에서 경쟁력을 한층 강화할 수 있을 것”이라며 “고객이 실질적으로 AI 혁신을 체감할 수 있는 서비스와 사업 범위를 넓혀 나갈 계획”이라고 밝혔다. 

2024.12.13

삼성, XR 헤드셋 ‘프로젝트 무한’ 공개…애플·메타와 경쟁삼성전자는 구글, 퀄컴과 12일(현지시간) 미국 뉴욕 구글 캠퍼스에서 개발자들을 대상으로 한 ‘XR 언락(XR Unlocked)’ 행사에서 ‘안드로이드 XR’ 플랫폼과 이를 탑재할 최초의 기기인 ‘프로젝트 무한(無限)’을 소개했다. 미국 뉴욕 구글 캠퍼스에서 진행된 ‘XR 언락’ 행사에서 소개된 XR 기기 ‘프로젝트 무한’XR(eXtended Reality)은 사용자가 시각·청각·움직임 등 다양한 감각을 활용해 주변 현실과 가상 세계를 넘나들며 새로운 경험을 제공하는 기술로 물리적 제한을 넘어 업무, 학습, 엔터테인먼트, 게이밍, 건강관리 등 일상을 크게 변화시킬 것으로 예상된다.이날 공개된 ‘안드로이드 XR’은 삼성전자, 구글, 퀄컴이 개방형 협업을 통해 공동 개발한 플랫폼으로 멀티모달 AI를 기반으로 사용자가 외부·가상 현실과 다양한 감각을 통해 상호작용할 수 있도록 지원한다.특히 구글 제미나이를 통해 자연스러운 대화 방식으로 새로운 정보를 탐색할 수 있고, 사용 상황과 맥락에 대한 이해를 바탕으로 맞춤형 응답을 제공하는 AI 에이전트 역할을 할 것으로 기대된다.안드로이드 XR은 기존 안드로이드, 오픈 XR, VR 및 모바일 AR 커뮤니티와 개방형 협업을 통해 확장성을 강화했고, 이를 바탕으로 삼성전자와 구글뿐 아니라 다양한 서드파티 앱·서비스 콘텐츠를 확보하며 플랫폼 규모를 확장한다는 계획이다.또한 헤드셋과 글래스를 포함한 다양한 폼팩터에 적용될 수 있는 범용성이 특징으로, XR을 활용할 수 있는 다양한 상황과 목적에 부합하는 여러 형태의 기기를 지원할 예정이다.코드명 ‘프로젝트 무한’은 안드로이드 XR이 적용될 최초의 헤드셋으로, 2025년 출시될 예정이다. 무한이라는 이름 그대로 물리적 한계를 초월한 공간에서 몰입감 넘치는 경험을 제공하겠다는 의미를 담고 있다.삼성전자 MX사업부 개발실장 최원준 부사장은 이 날 행사에 연사로 나서 “XR은 주변 현실과 가상 세계를 넘나들며 물리적 제약 없이 기술과 상호작용하는 방식으로 완전히 새로운 차원을 열어줄 것”이라며 “최첨단 XR 기술과 사용 맥락을 이해하는 멀티모달 AI의 결합으로 새로운 폼팩터 혁신을 위한 완벽한 조건이 갖춰졌다”고 말했다.특히 “안드로이드 XR 플랫폼의 뛰어난 확장성과 함께 다양한 폼팩터에 적용될 수 있는 강점이 있다”며 “끊임없이 확장되는 에코시스템 및 폭넓은 콘텐츠를 바탕으로 사용자에게 더욱 풍요로운 경험을 제공하게 될 것”이라고 강조했다.삼성전자 Immersive Solution 개발팀 김기환 부사장도 연사로 무대에 올라 안드로이드 XR 플랫폼의 세 가지 핵심 가치를 소개했다.김 부사장은 “일상에 의미 있는 변화를 가져올 플랫폼 구축을 위해 세 가지 핵심 가치에 중점을 뒀다”며 “무한한 시각적 콘텐츠를 통한 몰입감 넘치는 보는 경험, 시청각 및 움직임을 활용한 자연스러운 상호 작용과 함께 기존 안드로이드, 오픈(Open) XR, VR, 모바일 AR 커뮤니티와 개방형 협업을 추구하는 플랫폼을 실현하고자 했다”고 말했다.또한 “안드로이드 XR 플랫폼을 위해 선보일 첫 번째 기기는 ‘프로젝트 무한’ 헤드셋”이라며 “가장 편안하고 인체공학적인 디자인으로 최첨단 기술을 통해 비교할 수 없는 경험을 제공하도록 설계했다”고 강조했다. 

2024.12.13