首页 > 知识分享 > 知识分享 > 快手发布大模型产品“可图”,使用扩散模型以提升画质

快手发布大模型产品“可图”,使用扩散模型以提升画质

发布时间:2024-06-01 17:12:54

5月31日消息,快手自研大模型产品“可图”(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。目前,用户可以通过“可图大模型”官方网站和微信小程序,免费使用各项AI图像功能。值得注意的是,可图只需一张图片和几秒钟时间,便可生成一套AI图像。

在2024年一季度财报电话会上,快手首席执行官程一笑介绍,今年一季度,快手稳步推进自研大模型各项性能的迭代提升,并且加快大模型在各业务场景的应用。

从具体功能上看,一方面,可图提供AI形象定制功能,即图生图功能,通过人像保持技术,可保留人像的自然特征,一键生成各种风格的人像作品。目前,可图已上线10余种AI形象定制风格玩法。另一方面,快手可图大模型也提供AI创作功能,即文生图,支持用户自由输入文本,生成风格多样、创意十足的绘画作品。用户也可以上传参考图,可图将根据参考图像的风格、主题和细节等内容,生成既符合创意描述又与参考图相关的图像作品。

可图文生图作品。图|受访者供图

快手大模型团队的技术能力为产品提供了支撑。据官方介绍,“可图”大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研AI技术合成,覆盖了常见的千万级中文实体概念,还引入强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。

在画质提升方面,可图模型通过优化扩散模型的加噪去噪理论,以实现对高质量、细节丰富的图像生成的训练和推理的精准适配,引入了经过优质专家标注的图文数据集,以提升模型性能表现。

去年9月,“可图”大模型平台已在快手开启内测,快手在App评论区推出的“AI玩评”和“AI小快”等多种创新互动玩法,集合了文生图、图生图、扩图等功能,也是基于可图大模型能力。

知识分享更多>>

谷歌Gemini 3.1 Pro新王登场,一口气手搓Win11操作系统,造出模拟城市app,SVG效果绝了 4.769 GHz!AMD Radeon RX 9060 XT刷新显卡超频纪录 PVD“铝坨坨”:雷蛇发布猎魂光蛛Signature Edition光轴键盘 微软更新Mac版OneDrive 26.017:启用原生对话框、重塑活动中心 Gemini 3.1 Pro上线,春节AI大战硅谷更热闹 谷歌Gemini上线音乐模型 一句话即可生成歌曲 全网首例:用户反馈其iPhone Air的苹果自研5G基带硬件故障 奔驰预告全新豪华纯电MPV VLE:能自动泊车、后轮转向 全新Q5L上市、全新A6L首秀!越过千万辆之巅的奥迪,再度启航 现代帕里斯帝获得北美年度汽车! 一份年度成绩单,再证CR-V“全维度”哲学 上汽大众首款9系旗舰ID. ERA 9X亮相:一款车,一场转型的宣言 极狐乔心昱:北汽新能源自动驾驶技术全覆盖 L3级至L4级全贯通 50万内实用标杆?广汽本田新款飞度正式上市 焕新价6.68万元 央视镜头直击-21℃极寒战场!东风睿立达完成中汽冬测,破解物流冻阻难题 本田汽车近日官宣品牌标识焕新计划,沿用多年的经典\"H\"标将升级为全新设计版本,新标识定于2027年正式启用 星动纪元与顺丰科技签约,推动具身智能机器人在供应链落地 德系豪华三强,连续两年失守中国市场 万能的《甄嬛传》,在迅雷反腐这儿就失灵了? 沃尔沃EX60纯电SUV将搭载谷歌Gemini AI,配大尺寸竖屏 联发科发布天玑9500s:3nm工艺,支持硬件级光线追踪技术 消息称鸿蒙智行1月20日前后分批推送华为乾崑智驾ADS 4.1 美运营商Verizon服务中断十小时:波及数十万人,官方承诺补偿 金融时报:苹果避开AI烧钱大战,却成为谷歌与OpenAI的“造王者” 李小龙透露华为手表市场份额超手机,国内超30%使用非华为手机 贾国龙确认:西贝将关闭102家门店 “酸菜鱼之王”卖不动了? 太二亲手拆招牌,转战川菜赛道 日本霸占20年的汽车销量第一宝座,2026年被中国掀翻了? 为何中国茶业跑不出一个「茅台」? 房企聚焦核心城市“掐尖”,北上杭三城2025年土地出让收入均超千亿元