구글, 텍스트 생성에 확산을 적용: DiffusionGemma 공개

|

하드웨어 뉴스

3 구글, 텍스트 생성에 확산을 적용: DiffusionGemma 공개 본문보기 QM포시포시 QM포시포시 | 1.7K | 7 2026.06.11 10:13

출처 1 : https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation

<div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);"><img src="https://img2.quasarzone.com/editor/2026/06/11/b0aca913f014be2d01ec480ef7795a3f.png" alt="퀘이사존"> 오늘, 텍스트 확산(text diffusion)이라는 매우 빠른 텍스트 생성 방식을 탐구하는 실험적인 오픈 소스 모델인 DiffusionGemma를 소개합니다. Apache 2.0 라이선스로 배포되는 이 26B 규모의 MoE은 일반적인 자기회귀 방식의 LLM에서 토큰 단위로 순차적으로 처리하는 방식을 뛰어넘어, 텍스트 블록 전체를 동시에 생성하여 GPU에서 최대 4배 빠른 텍스트 생성 속도를 제공합니다. 업계 최고 수준의 파라미터별 인텔리전스를 자랑하는 Gemma 4 제품군과 최첨단 Gemini Diffusion 연구를 기반으로 구축된 DiffusionGemma는 생성 속도를 극대화하도록 설계된 새로운 확산 헤드를 통합했습니다. 자기회귀 방식의 Gemma 4 모델은 여전히 고품질의 결과물을 위한 표준이지만, DiffusionGemma는 인라인 편집, 빠른 반복 작업, 비선형 텍스트 구조 생성과 같이 속도가 중요한 대화형 로컬 워크플로를 연구하는 연구원과 개발자를 위해 설계되었습니다. <img src="https://img2.quasarzone.com/editor/2026/06/11/d49ea3548cf940f1fffe3062159c575d.webp" alt="퀘이사존"> 실시간 대화형 AI 애플리케이션을 개발하는 개발자는 종종 로컬 추론의 지연 시간 병목 현상으로 어려움을 겪습니다. DiffusionGemma는 이러한 문제를 직접적으로 해결하지만, 몇 가지 주요 장단점이 있습니다. <ul><li style="text-align: justify; line-height: 2; min-height: 30px;">매우 빠른 추론: 디코딩 병목 현상을 메모리 대역폭에서 컴퓨팅 성능으로 전환함으로써, DiffusionGemma는 전용 GPU에서 최대 4배 빠른 토큰 출력을 생성합니다. (단일 NVIDIA H100에서 초당 1,000개 이상의 토큰, NVIDIA RTX 5090에서 초당 700개 이상의 토큰) </li><li style="text-align: justify; line-height: 2; min-height: 30px;">접근 가능한 하드웨어 용량: 추론 시 3.8B 파라미터만 활성화하는 총 26B의 MoE 모델로 작동하는 DiffusionGemma는 양자화 시 고급 전용 소비자 GPU의 18GB VRAM 용량 내에서 충분히 작동합니다. </li><li style="text-align: justify; line-height: 2; min-height: 30px;">양방향 어텐션: 각 순방향 패스에서 256개의 토큰을 병렬로 생성하여 모든 토큰이 다른 모든 토큰에 어텐션할 수 있도록 합니다. 이는 인라인 편집, 코드 삽입, 아미노산 서열 또는 수학 그래프와 같은 비선형 영역에서 상당한 이점을 제공합니다. </li><li style="text-align: justify; line-height: 2; min-height: 30px;">지능형 자체 수정: 모델은 자체 출력을 반복적으로 개선하여 전체 텍스트 블록을 한 번에 평가하고 오류를 실시간으로 수정할 수 있습니다. </li><li style="text-align: justify; line-height: 2; min-height: 30px;">실험적 상태 및 프로덕션 권장 사항: DiffusionGemma는 속도와 병렬 레이아웃 생성을 우선시하기 때문에 전반적인 출력 품질이 표준 Gemma 4보다 낮습니다. 최고 품질이 요구되는 애플리케이션의 경우 표준 Gemma 4를 사용하는 것이 좋습니다.</li></ul> 미세 조정을 통해 특정 작업에서 DiffusionGemma의 성능을 향상시킬 수 있습니다. 아래 예에서 Unsloth는 DiffusionGemma를 미세 조정하여 스도쿠를 플레이하도록 했습니다. 스도쿠는 각 토큰이 다음 토큰에 의존하기 때문에 자기회귀 모델이 어려움을 겪는 작업입니다. DiffusionGemma의 양방향 어텐션 덕분에 이 작업이 훨씬 쉬워집니다. <img src="https://img2.quasarzone.com/editor/2026/06/11/3bff79c01d199847b1b656973f07fe71.webp" alt="퀘이사존"> 텍스트에 확산 알고리즘을 사용하는 이유는 무엇일까요? AI 연구 커뮤니티는 수년간 확산 기반 텍스트 생성 기술을 연구해 왔지만, 이를 대규모 모델에 적용하는 것은 여전히 어려운 과제였습니다. DiffusionGemma는 모델의 하드웨어 활용 방식을 혁신적으로 변화시켜 이 문제를 해결합니다. 기존 모델의 한계점대부분의 언어 모델은 마치 타자기처럼 왼쪽에서 오른쪽으로 한 번에 하나의 토큰씩 생성합니다. 클라우드 환경에서는 서버가 수천 개의 사용자 요청을 일괄 처리하여 하드웨어 부하를 분산할 수 있기 때문에 효율적입니다. 하지만 로컬 환경에서 단일 사용자를 위해 실행할 경우, 이러한 단어 단위 처리 방식은 전용 GPU나 TPU의 활용도를 떨어뜨립니다. 대부분의 시간을 다음 "키 입력"을 기다리는 데 소비하기 때문입니다. DiffusionGemma는 이러한 비효율성을 역전시킵니다. 단어를 순차적으로 예측하는 대신, 256개의 토큰으로 구성된 전체 단락을 동시에 생성합니다. 컴퓨터 프로세서에 더 많은 작업을 한 번에 처리하도록 함으로써, DiffusionGemma는 하드웨어의 잠재력을 최대한 활용합니다. 마치 단일 단어를 순차적으로 입력하는 타자기에서 전체 텍스트 블록을 동시에 찍어내는 거대한 인쇄기로 모델 추론 방식을 업그레이드하는 것과 같습니다. 즉, DiffusionGemma의 속도 향상은 로컬 및 저속 동시 추론에 최적화되어 있습니다. 높은 QPS를 처리하는 클라우드 환경에서는 자기회귀 모델을 효율적으로 배포하여 컴퓨팅 자원을 최대한 활용할 수 있으므로, DiffusionGemma의 병렬 디코딩은 효율성이 떨어지고 오히려 서비스 비용이 증가할 수 있습니다. 처리량 이점은 단일 가속기에서 낮은 배치 크기에서 중간 배치 크기일 때 가장 두드러집니다. 텍스트 확산 작동 방식시각적 정적인 이미지에서 시작하여 반복적으로 다듬어 선명한 이미지를 생성하는 AI 이미지 생성기와 유사하게, DiffusionGemma는 텍스트에 이 과정을 적용합니다. <ul><li style="text-align: justify; line-height: 2; min-height: 30px;">캔버스: 모델은 무작위로 생성된 자리 표시자 토큰으로 구성된 캔버스에서 시작합니다.</li><li style="text-align: justify; line-height: 2; min-height: 30px;">반복적인 다듬기: 모델은 여러 번의 패스를 거쳐 올바른 토큰을 확정하고 이를 문맥 단서로 사용하여 나머지 부분을 다듬습니다.</li><li style="text-align: justify; line-height: 2; min-height: 30px;">최종 다듬기: 텍스트가 고품질 출력으로 수렴됩니다.</li></ul> 이 모델은 생성과 동시에 전체 단락을 처리할 수 있기 때문에 복잡한 마크다운 서식을 완벽하게 닫거나 거의 실시간으로 코드를 생성하고 렌더링하는 등 새로운 모델 동작 패턴을 구현할 수 있습니다. <img src="https://img2.quasarzone.com/editor/2026/06/11/c399f421e70dbbdf544e08df2b62103c.png" alt="퀘이사존"> </td></tr></tbody></table></div>

작성자 프로필

QM포시포시

QM 포인트 : 277,671 exp

작성물 댓글

회원 자기소개 펼치기

댓글: 7개

전체 게시판

전체 뉴스/정보 질문/토론 커뮤/유머

0	파워서플라이 고주파 문제 질문 2 파워서플라이 - 질문 user_1146154 \| 213 \| 06.12
4	아수스 신형 보조모니터 XG129C 짧은 리뷰 19 자유게시판 - 잡담 Acre \| 631 \| 06.12
2	메모리 속도를 최대 4% 올려준다는 ultra low latency가 적용된 베타바이오스가 올라왔습니다 10 CPU/메인보드/램 - 정보 부족한컴덕 \| 898 \| 06.12
0	pc 견적 도움 부탁드립니다ㅠ.ㅠ! 3 PC조립/견적 - 질문 user_1146152 \| 114 \| 06.12
0	ATI Rage Fury MAXX 하드웨어박물관 FP32 \| 56 \| 06.12
0	cpu교체하다가 앞면에 써멀이좀 뭍었는데 닦는방법이있나요?? 5 CPU/메인보드/램 - 질문 자스기 \| 373 \| 06.12
0	현대 제네시스 마그마 하이퍼카 르망24 출전 1 자유게시판 - 잡담 광양오버 \| 244 \| 06.12
5	XBOX 게임패스 주말 무료 플레이 게임 5 게임 뉴스 - 멀티플랫폼 빌보 \| 1.6K \| 06.12
0	asus prime a520m 2이거 사면 될까요? 2 CPU/메인보드/램 - 질문 user_1141176 \| 169 \| 06.12
22	에픽게임즈 스토어 무료 게임 배포 16 게임 뉴스 - PC게임 빌보 \| 10.2K \| 06.12
6	vram을 많이 먹는 게임의 경우에는 5070보다 5060ti 16기가가 더 나은 건가요? 42 그래픽카드 - 질문 user_489834 \| 1.7K \| 06.11
0	윈도우 11 KB5094126 (26200.8655) 업데이트 버그인가요? 1 OS/소프트웨어 - 질문 옵티무스 \| 531 \| 06.11
1	길티기어 -스트라이브- 5주년 기념 일러스트 공개 1 게임 뉴스 - 멀티플랫폼 빌보 \| 518 \| 06.11
0	Fancontrol GPU 펜 속도 설정 질문..! 1 그래픽카드 - 질문 user_1145891 \| 137 \| 06.11
2	5090 가격이 앞으로 계속 오를까여?? 9 그래픽카드 - 질문 user_664225 \| 687 \| 06.11
1	34인치 wqhd ips 모니터 추천 부탁드립니다! 1 모니터 - 질문 user_1141273 \| 483 \| 06.11
2	스트레인저 댄 헤븐, 전투 게임플레이 영상 2 게임 뉴스 - 멀티플랫폼 빌보 \| 686 \| 06.11
5	제대로 붉며들었나봅니다... 10 스팀/PC게임 - 잡담 나나나데 \| 712 \| 06.11
0	메모리 여유가 있는데 가상메모리를 이렇게 쓰는게 맞나요? 9 CPU/메인보드/램 - 질문 arcteric \| 591 \| 06.11
1	그래픽, 일러스트 작업용 견적 보완 부탁드립니다 4 PC조립/견적 - 질문 user_996730 \| 117 \| 06.11

출석체크

질문하기

최신 파트너 핫딜

1 / 5

20,910원

0	파워서플라이 고주파 문제 질문 2 파워서플라이 - 질문 user_1146154 \| 213 \| 06.12
4	아수스 신형 보조모니터 XG129C 짧은 리뷰 19 자유게시판 - 잡담 Acre \| 631 \| 06.12
2	메모리 속도를 최대 4% 올려준다는 ultra low latency가 적용된 베타바이오스가 올라왔습니다 10 CPU/메인보드/램 - 정보 부족한컴덕 \| 898 \| 06.12
0	pc 견적 도움 부탁드립니다ㅠ.ㅠ! 3 PC조립/견적 - 질문 user_1146152 \| 114 \| 06.12
0	ATI Rage Fury MAXX 하드웨어박물관 FP32 \| 56 \| 06.12
0	cpu교체하다가 앞면에 써멀이좀 뭍었는데 닦는방법이있나요?? 5 CPU/메인보드/램 - 질문 자스기 \| 373 \| 06.12
0	현대 제네시스 마그마 하이퍼카 르망24 출전 1 자유게시판 - 잡담 광양오버 \| 244 \| 06.12
5	XBOX 게임패스 주말 무료 플레이 게임 5 게임 뉴스 - 멀티플랫폼 빌보 \| 1.6K \| 06.12
0	asus prime a520m 2이거 사면 될까요? 2 CPU/메인보드/램 - 질문 user_1141176 \| 169 \| 06.12
22	에픽게임즈 스토어 무료 게임 배포 16 게임 뉴스 - PC게임 빌보 \| 10.2K \| 06.12
6	vram을 많이 먹는 게임의 경우에는 5070보다 5060ti 16기가가 더 나은 건가요? 42 그래픽카드 - 질문 user_489834 \| 1.7K \| 06.11
0	윈도우 11 KB5094126 (26200.8655) 업데이트 버그인가요? 1 OS/소프트웨어 - 질문 옵티무스 \| 531 \| 06.11
1	길티기어 -스트라이브- 5주년 기념 일러스트 공개 1 게임 뉴스 - 멀티플랫폼 빌보 \| 518 \| 06.11
0	Fancontrol GPU 펜 속도 설정 질문..! 1 그래픽카드 - 질문 user_1145891 \| 137 \| 06.11
2	5090 가격이 앞으로 계속 오를까여?? 9 그래픽카드 - 질문 user_664225 \| 687 \| 06.11
1	34인치 wqhd ips 모니터 추천 부탁드립니다! 1 모니터 - 질문 user_1141273 \| 483 \| 06.11
2	스트레인저 댄 헤븐, 전투 게임플레이 영상 2 게임 뉴스 - 멀티플랫폼 빌보 \| 686 \| 06.11
5	제대로 붉며들었나봅니다... 10 스팀/PC게임 - 잡담 나나나데 \| 712 \| 06.11
0	메모리 여유가 있는데 가상메모리를 이렇게 쓰는게 맞나요? 9 CPU/메인보드/램 - 질문 arcteric \| 591 \| 06.11
1	그래픽, 일러스트 작업용 견적 보완 부탁드립니다 4 PC조립/견적 - 질문 user_996730 \| 117 \| 06.11

전체 게시판

|

하드웨어 뉴스

구글, 텍스트 생성에 확산을 적용: DiffusionGemma 공개

작성자 프로필

전체 게시판

파워서플라이 고주파 문제 질문

아수스 신형 보조모니터 XG129C 짧은 리뷰

메모리 속도를 최대 4% 올려준다는 ultra low latency가 적용된 베타바이오스가 올라왔습니다

pc 견적 도움 부탁드립니다ㅠ.ㅠ!

ATI Rage Fury MAXX

cpu교체하다가 앞면에 써멀이좀 뭍었는데 닦는방법이있나요??

현대 제네시스 마그마 하이퍼카 르망24 출전

XBOX 게임패스 주말 무료 플레이 게임

asus prime a520m 2이거 사면 될까요?

에픽게임즈 스토어 무료 게임 배포

vram을 많이 먹는 게임의 경우에는 5070보다 5060ti 16기가가 더 나은 건가요?

윈도우 11 KB5094126 (26200.8655) 업데이트 버그인가요?

길티기어 -스트라이브- 5주년 기념 일러스트 공개

Fancontrol GPU 펜 속도 설정 질문..!

5090 가격이 앞으로 계속 오를까여??

34인치 wqhd ips 모니터 추천 부탁드립니다!

스트레인저 댄 헤븐, 전투 게임플레이 영상

제대로 붉며들었나봅니다...

메모리 여유가 있는데 가상메모리를 이렇게 쓰는게 맞나요?

그래픽, 일러스트 작업용 견적 보완 부탁드립니다

[쿠팡] 위크나인 휴대폰 방수 노샘 케이스 1

[네이버] 알파스캔, Q27G40E 구매 고객 대상 Q2... 2

[네이버] (A급 리퍼비시) 마이크로닉스 쿨맥스 STEA... 1

[기타] 필립스 3000 시리즈 에어프라이어 7.2L N... 1

[지마켓] 영광농협 새청무10kg 상등급 0

[기타] 🚨수도권 S26 성지대란🚨 LG기변 5.4만🔥 ... 2

[기타] LG번이 S26 공짜🔥 KT번이 15만🔥SK번이... 1

[네이버] 17시🔥삼성 55/85인치 대형 비즈니스 TV... 3

[지마켓] 빡세일🎊 LG 32인치게이밍모니터 32G600... 1

[알리] 🔥여름세일🔥 마이크로닉스 WIZMAX ML-36... 2

[알리] 🔥여름세일🔥 ASRock 스틸레전드 SL-100... 2

[네이버] 이 가격에 LG신상을 왜 안 삼? LG G4 ... 1

[지마켓] 냉감 작업복 바지 1+1+1 2

[기타] 9800X3D + RX 9070 XT 탑재! 리... 2

[옥션] 등산/스포츠 발가락양말 1

[지마켓] 밸런시스 스노쿨링 풀페이스 마스크 1

[옥션] 남녀 팬츠 모음전 슬랙스/조거/청바지/반바지... 1

[네이버] 🔥 여름엔 역시 메쉬!! 5D 암레스트 시원한... 3

[옥션] C to C PD 고속 충전 케이블 1m 1+1 1

[기타] 🚨S25 엣지 역대급 특가🚨 KT번이 15.1만... 3

5만 원짜리로 게임할 수 있을까? 6

MSI는 중급기도 성능이 므시므시해 112

OLED 게이밍 모니터, 이제 ROG도 가격 사정권? 8

TWS 하나를 사더라도 평범하지 않고 싶다면 173

성능에 조준경을 올린 겜트북 114

우드 포인트가 들어간 책상 위에 놓고 쓰기 좋은 케이스... 188

DDR5 정상화에 2년 걸리나? 크아 서비스 종료?! 16

6월 진행한 네 개 쇼케이스로 읽는 게임 산업 현황... 90

작더라도 업그레이드는 언제나 환영이야 187

5K2K 해상도에 썬더볼트 5까지! 작업을 위한 최고의 ... 247

허브가 따로 필요 없는 4K 모니터 239

높은 키캡을 깎아낸 자리에 남은 것들 129

신고하기