![]() |
|
中国大陆网络巨头腾讯16日正式发布AI业内首个毫秒级回应的即时生图大模型——混元图像2.0(Hunyuan Image2.0),此一即时生图大模型已在在腾讯混元官方网站上线,并对外开放注册体验。该模型主要有2大特点:即时生图、超写实画质。
据《快科技》报道,腾讯混元图像2.0相比前代模型,其参数量提升了一个数量级,得益于超高压缩倍率的图像转码器以及全新扩散架构,其生图速度显著快于行业领先模型。
报道指出,在同类商业产品每张图推理速度需要5到10秒的情况下,腾讯混元可实现“毫秒级”回应,支持用户可以一边打字或者一边说话一边出图,改变了传统“抽卡—等待—抽卡”的方式。
在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准GenEval(Geneval Bench)上,腾讯混元图像2.0模型准确率超过95%,远超其他同类模型。
腾讯表示,腾讯混元图像2.0引入多模态大语言模型(MLLM)作为文本编码器,配合自研的结构化caption系统,不仅能理解你在说什么,更能推测出你希望画面“怎么表达”。哪怕你一句话里埋了三层含义,它也能一一拆解,再一笔一笔划出来。
报道说,除了文字输入,腾讯混元图像2.0还可以通过语音直接输入提示词,系统将语音自动转写为文字,并在识别后即时生成图像,适用于直播讲解、移动创作等场景。
也可以上传草图作为参考,模型能自动识别线稿的结构与构图逻辑,再结合提示词内容补全光影、材质、背景等细节,迅速扩展成图。

提示词:“人像摄影,爱因斯坦,背景是东方明珠,自拍视角”在混元图像2.0生成的超写实画质AI图片。(图/腾讯混元AI)
| 当前新闻共有0条评论 | 分享到: |
|
||||||||||
| 评论前需要先 登录 或者 注册 哦 |
||||||||||||
| 24小时新闻排行榜 | 更多>> |
| 1 | 习家“储君”出事?皇侄齐明正突然消失 |
| 2 | 北京七环大爆炸,传老习两口子躲了整整两天 |
| 3 | 习走错“关键一步” 渐失话语权 |
| 4 | 跨年夜,中国多个大城市现诡异一幕 |
| 5 | 大蒜是尿酸的杀手?想要肾脏健康这些蔬菜要 |
| 48小时新闻排行榜 | 更多>> |
| 一周博客排行 | 更多>> |
| 一周博文回复排行榜 | 更多>> |
| 1 | 台湾问题:麻将停牌 | 随意生活 |
| 2 | 川普到底卖了乌克兰没有? | 山蛟龙 |
| 3 | 梅兰芳和兩位仍然在世的入室弟 | 玉质 |
| 4 | 第一美女:《越人歌》-宋祖英 | YOLO宥乐 |
| 5 | 做这道题,知道明年你要去哪? | 末班车 |
| 6 | 关于离岸爱国 | 阿里克斯Y |
| 7 | 海外中文出版的新路基本开通, | 高伐林 |
| 8 | 70%美国大学毕业生找不到工作 | 乐维 |
| 9 | 大湾区的整合梦 | 文庙 |
| 10 | 给菓趣的回复,你至少有放风的 | renweida |