모바일 뉴스 - 최신 모바일기기/스마트폰/태블릿 정보를 만나보세요

애플, 사진 해석 및 물체 수 계산 가능한 AI 모델 공개

user_투코

6 767 2 2024.03.19 10:57

<p></p><div style="text-align: center;"><img src="https://img2.quasarzone.com/editor/2024/03/19/f0985d37a9886a2b4fec57f5c3edf38a.webp" alt="퀘이사존" style="background-color: initial; width: 75%;"></div><span><div style="text-align: center;"><br></div></span><p></p><div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);"><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">무슨 일이 있었나요? 애플은 제너레이티브 AI 도입에 소극적이었지만 이미지와 텍스트 데이터를 모두 해석할 수 있는 멀티모달 대규모 언어 모델인 MM1의 도입으로 변화가 있을 수 있습니다. 이 기능은 애플이 구글의 제미니 AI를 통합할 것이라는 소문도 있지만, 애플의 차세대 단말기와 서비스에 포함될 가능성이 있습니다.
<span style="font-size: 12pt;"></span></p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">애플 연구원들은 텍스트와 시각 정보를 모두 통합하는 대규모 언어 모델(LLM)을 학습하기 위한 새로운 접근 방식인 MM1을 개발했습니다. 연구진이 발표한 논문에 따르면 MM1은 이미지-캡션 쌍, 인터리브 이미지-텍스트 문서, 텍스트 전용 데이터로 구성된 데이터 세트를 활용하여 최대 300억 개의 파라미터를 포함하는 멀티모달 모델 제품군의 일부입니다.
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">멀티모달 대규모 언어 모델(MLLM)은 이미지와 텍스트 데이터를 처리하여 텍스트 출력을 생성하는 대규모 기초 모델이라고 연구진은 설명합니다. "LLM의 부상 이후 MLLM은 기초 모델의 다음 개척지로 떠오르고 있습니다."라고 연구진은 말합니다. 애플, 사진 해석 및 사물 수 계산이 가능한 AI 모델 공개
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">애플은 MM1이 물체를 세고, 이미지의 일부를 식별하고, 일상적인 사물에 대한 상식 및 단어 지식을 보여주고, 기본적인 수학적 기능을 수행할 수 있다고 주장합니다. 또한 문맥 내 학습을 지원하므로 각 쿼리에 대해 모델을 재학습하거나 미세 조정할 필요 없이 제공된 문맥을 기반으로 쿼리를 이해할 수 있습니다. 또한 다중 이미지 추론 기능을 통해 여러 이미지를 해석하고 결론을 도출할 수 있습니다.
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">애플은 사용자가 모델에게 사진을 보여주며 메뉴판의 가격을 기준으로 테이블에 있는 모든 맥주의 가격이 얼마인지 묻는 예를 제공합니다.</p></td></tr></tbody></table><p style="line-height: 2;"></p></div><p><span></span></p><div style="text-align: center;"><br></div><div style="text-align: center;"><img src="https://img2.quasarzone.com/editor/2024/03/19/ccba2a14738dd38ff7d0e73b4b081000.webp" alt="퀘이사존" style="background-color: initial; width: 75%;"></div><div style="text-align: center;"><br></div><p></p><div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);"><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">모델은 이미지에 맥주 가격이 표시된 메뉴가 있지만 테이블에 어떤 특정 맥주가 있는지 완전히 명확하지 않다는 점을 지적하며 응답합니다. 하지만 사용자에게 보이는 가격을 기반으로 예상 가격을 제공할 수 있다고 말합니다. 그 대답은 이렇습니다: "메뉴에 표시된 맥주 가격은 다음과 같습니다: 마그나: 5, 메달라: 5, 하이네켄: 6 프레지던트: 6 테이블에 있는 맥주가 마그나, 메달라, 하이네켄, 프레지던트이고 각각 두 개씩 있다고 가정하면 마그나: 2 x 5 = 10, 메달라: 2 x 5 = 10, 하이네켄: 2 x 6 = 12, 프레지던트: 2 x 6 = 12 총: 10 + 10 + 12 + 12 = 44를 지불해야 합니다."
<span style="font-size: 12pt;"></span></p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">멀티모달 모델을 연구하고 있는 애플 수석 연구 엔지니어 Brandon McKinzie에 따르면 MM1은 "시작에 불과하다"고 합니다. 그는 또한 애플이 "이미 차세대 모델에 대해 열심히 연구하고 있다"고 말했습니다.
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px"><br></p></td></tr></tbody></table></div><p></p><div class="twitter-tweet twitter-tweet-rendered" style="width: 100%; margin: 10px auto; display: flex; max-width: 550px;"><iframe id="twitter-widget-0" scrolling="no" frameborder="0" allowtransparency="true" allowfullscreen="true" class="" style="position: static; visibility: visible; width: 550px; height: 807px; display: block; flex-grow: 1;" title="X Post" src="https://platform.twitter.com/embed/Tweet.html?dnt=false&embedId=twitter-widget-0&features=eyJ0ZndfdGltZWxpbmVfbGlzdCI6eyJidWNrZXQiOltdLCJ2ZXJzaW9uIjpudWxsfSwidGZ3X2ZvbGxvd2VyX2NvdW50X3N1bnNldCI6eyJidWNrZXQiOnRydWUsInZlcnNpb24iOm51bGx9LCJ0ZndfdHdlZXRfZWRpdF9iYWNrZW5kIjp7ImJ1Y2tldCI6Im9uIiwidmVyc2lvbiI6bnVsbH0sInRmd19yZWZzcmNfc2Vzc2lvbiI6eyJidWNrZXQiOiJvbiIsInZlcnNpb24iOm51bGx9LCJ0ZndfZm9zbnJfc29mdF9pbnRlcnZlbnRpb25zX2VuYWJsZWQiOnsiYnVja2V0Ijoib24iLCJ2ZXJzaW9uIjpudWxsfSwidGZ3X21peGVkX21lZGlhXzE1ODk3Ijp7ImJ1Y2tldCI6InRyZWF0bWVudCIsInZlcnNpb24iOm51bGx9LCJ0ZndfZXhwZXJpbWVudHNfY29va2llX2V4cGlyYXRpb24iOnsiYnVja2V0IjoxMjA5NjAwLCJ2ZXJzaW9uIjpudWxsfSwidGZ3X3Nob3dfYmlyZHdhdGNoX3Bpdm90c19lbmFibGVkIjp7ImJ1Y2tldCI6Im9uIiwidmVyc2lvbiI6bnVsbH0sInRmd19kdXBsaWNhdGVfc2NyaWJlc190b19zZXR0aW5ncyI6eyJidWNrZXQiOiJvbiIsInZlcnNpb24iOm51bGx9LCJ0ZndfdXNlX3Byb2ZpbGVfaW1hZ2Vfc2hhcGVfZW5hYmxlZCI6eyJidWNrZXQiOiJvbiIsInZlcnNpb24iOm51bGx9LCJ0ZndfdmlkZW9faGxzX2R5bmFtaWNfbWFuaWZlc3RzXzE1MDgyIjp7ImJ1Y2tldCI6InRydWVfYml0cmF0ZSIsInZlcnNpb24iOm51bGx9LCJ0ZndfbGVnYWN5X3RpbWVsaW5lX3N1bnNldCI6eyJidWNrZXQiOnRydWUsInZlcnNpb24iOm51bGx9LCJ0ZndfdHdlZXRfZWRpdF9mcm9udGVuZCI6eyJidWNrZXQiOiJvbiIsInZlcnNpb24iOm51bGx9fQ%3D%3D&frame=false&hideCard=false&hideThread=false&id=1768658029246132441&lang=ko&origin=https%3A%2F%2Fquasarzone.com%2Fbbs%2Fqn_mobile%2Fcreate&sessionId=3b97f2981a8184a2f4d80e66f1834c85d6849508&theme=light&widgetsVersion=2615f7e52b7e0%3A1702314776716&width=550px" data-tweet-id="1768658029246132441"></iframe><br></div><div class="twitter-tweet twitter-tweet-rendered" style="width: 100%; margin: 10px auto; display: flex; max-width: 550px;"><br></div><div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);"><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">MM1에 대한 소식은 현재 애플이 다음 아이폰 시리즈에 구글의 제미니 AI 기술을 사용하기 위해 라이선스 협상을 진행 중이라는 보도가 나온 가운데 나온 것입니다. 이 파트너십을 통해 구글 제미니는 더 많은 고객층을 확보하고, 애플은 최첨단 AI 기술을 이용할 수 있게 될 것입니다.
<span style="font-size: 12pt;"></span></p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">이러한 협상은 또한 애플의 AI 이니셔티브가 기대만큼 빠르게 진행되지 않을 수도 있음을 암시합니다. 애플은 거대 기술 기업 중 가장 신중하게 제너레이티브 AI를 채택해 왔으며, 시장이 어느 정도 성숙할 때까지 기다렸다가 도입하는 것을 선호해 왔습니다.
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px">MM1의 공개는 애플의 차세대 서비스에 대한 새로운 가능성을 열어줍니다. MM1이 시리 2.0에 통합되어 이미지를 기반으로 질문에 답할 수 있을 것으로 예상할 수 있습니다. 또한 새로운 모델을 통해 아이메세지가 개선되어 공유 이미지를 기반으로 사용자에게 보다 정확한 답변을 제안할 수 있습니다.
</p><p align="justify" style="text-align: justify; line-height: 2;min-height: 30px"><br></p></td></tr></tbody></table><p style="line-height: 2;"></p></div><div class="twitter-tweet twitter-tweet-rendered" style="width: 100%; margin: 10px auto; display: flex; max-width: 550px;"><br></div>

user_투코

행성: 슈퍼지구

포인트: 20,307 exp

작성물 댓글

모든회원 자기소개 펼치기

댓글: 6개

모바일 뉴스 - 최신 모바일기기/스마트폰/태블릿 정보를 만나보세요

공지 뉴스게시판 특별 규정(23.09.08)

퀘이사존

6.8k

11-08

전체 애플 안드로이드 윈도우 주변기기 업계동향 기타

추천	제목
2	갤럭시 핏3, 갖출 건 다 갖췄네.. 충전 걱정 없고 수면 측정 훌륭 4 주변기기 블랙웰 940 04-08
2	'갤S24와 함께하는 24시간'…AI기능 담은 단편영화, 5000만뷰 돌파 4 기타 블랙웰 601 04-08
6	KT '5G 28㎓' 기지국, 제4이통사에 판다 13 업계동향 빌보 2.9k 04-08
4	'제4이통 주축' 스테이지파이브, 지난해 130억원대 영업손실 7 업계동향 빌보 1.5k 04-07
4	삼성전자, 갤럭시 S23 시리즈 One UI 6.1 지문 인식 버그 수정 업데이트 준비 중 10 안드로이드 Wormhole 4.9k 04-07
10	[루머] 다음 주에 갤럭시 S22, Z 폴드 4 및 Z 플립 4, A54 One UI 6.1 업데이트 배포 예정 10 안드로이드 Wormhole 4.3k 04-07
16	"야구 중계 엉망진창" 욕해도…티빙, OTT 2위 굳혀 35 기타 블랙웰 3.2k 04-07
0	갤럭시 버즈3 프로, 언제·어떻게 나올까 4 주변기기 블랙웰 1.8k 04-07
2	전환지원금에 알뜰폰 순유입 '뚝'…은행 진출까지 '산 넘어 산' 7 업계동향 빌보 1.3k 04-07
24	'5G 불만' 속 'LTE 홀대' 40 업계동향 빌보 6.4k 04-06
3	불법 스팸 월 13건꼴 수신…"해외 대량 발송 증가" 7 기타 빌보 679 04-06
10	퀄컴 스냅드래곤 AP 비교 다이 비교샷 7 업계동향 블레이더영혼 2.9k 04-06
5	Android 15에는 향상된 데스크톱 모드가 제공될 수 있습니다 6 안드로이드 QM지름 2.4k 04-06
4	Pixel 사용자는 곧 통화 기록에서 알 수 없는 번호를 쉽게 '조회'할 수 있게 됩니다 4 안드로이드 QM지름 720 04-06
2	[루머] 삼성전자, 갤럭시 워치4 기반 FE 모델 출시 예정 2 주변기기 Wormhole 1.8k 04-06
14	애플 CEO 팀쿡, 거의 20만 주에 가까운 애플 주식 매각 25 업계동향 Wormhole 7.3k 04-06
6	[영상] 갤럭시 S24 울트라 강력한 화면 내구성의 비밀 : 코닝 고릴라 아머 6 안드로이드 Wormhole 1.9k 04-06
4	갤럭시 A35 분해 영상, 높은 수리성 점수 획득 및 전작보다 더 큰 베이퍼 챔버 탑재 확인 7 안드로이드 Wormhole 1.5k 04-06
2	더 날씬하고 똑똑해진 '갤폴드6' 7월 출격 4 안드로이드 블랙웰 1.6k 04-06
2	갤S24 AI폰 효과 톡톡…삼성전자 1분기 영업익, MX가 절반 이상 벌었다 3 업계동향 블랙웰 650 04-06
2	iPhone 16 라인의 OLED 패널 공급업체는 더 얇은 베젤 디자인으로 인해 문제를 겪고 있습니다 4 애플 QM지름 2.8k 04-05
2	Vivo T3x 칩셋 및 배터리 사양 유출 5 안드로이드 QM바나 406 04-05
4	실패한 두 프로젝트에 수십억 달러와 많은 시간을 투자한 애플, 600명 이상의 직원 해고 8 애플 QM지름 2.7k 04-05
4	Android 15에서는 블루투스를 완전히 끌 수 없습니다 8 안드로이드 QM지름 7.7k 04-05
2	애플, 호환되는 아이폰 모델용 iOS 17.5 베타 1 공개 버전 출시 2 애플 QM페이드 2.2k 04-05
0	구글이 생각보다 훨씬 빨리 내 기기 찾기 네트워크를 출시할 수 있음 1 업계동향 QUASARZONE 746 04-05
6	삼성전자, One UI 6.1에서 갤럭시 S23 터치 스크린 문제 인정 및 임시 해결 방법 제공 8 안드로이드 Wormhole 11.9k 04-05
2	광고 급감 X, 인플루언서 끌어안기…무료 구독·인증마크 제공 5 업계동향 빌보 866 04-05
2	Android 15의 개인 공간 유출로 휴대폰 개인 정보를 개선하는 방법 자세히 알아보기 3 안드로이드 QM지름 1k 04-05
2	구글은 곧 AI 기반 검색 결과에 대해 요금을 부과할 수 있습니다 4 업계동향 Wormhole 652 04-05