本文源自:金融界
金融界2024年1月31日消息,据国家知识产权局公告,浪潮电子信息产业股份有限公司申请一项名为“一种图像生成方法、装置、设备及计算机可读存储介质“,公开号CN117474796A,申请日期为2023年12月。
专利摘要显示,本发明涉及图像生成技术领域,具体公开了一种图像生成方法、装置、设备及计算机可读存储介质,在利用文生图扩散模型对待处理文本进行预设次数的去噪处理的过程中,在每次去噪处理中对生成的中间图像进行图像识别,根据图像识别结果和待处理文本的内容误差更新文生图扩散模型的第一阶段去噪向量,得到第二阶段去噪向量,以第二阶段去噪向量作为本次去噪处理的去噪向量;利用最终的第二阶段去噪向量生成与待处理文本对应的结果图像。通过两阶段去噪,加强了每次去噪过程中对待处理文本中包含的细节信息的把控,由此生成的结果图像可以对待处理文本中包含的细节信息进行精准刻画,从而提高了文本图像模态转换的准确性。
发布于:北京
相关推荐
浪潮信息申请图像生成专利,提高文本图像模态转换的准确性
过去五年里,AI 图像生成技术走了多远?
清华大学取得RGB-IR图像色彩恢复及校正专利,实现图像关键区域权重动态调节
多模态学习,带来AI全新应用场景?
Meta开发出文本生成图像模型CM3Leon,号称业界最佳
Adobe加入生成式AI战局:推出Firefly工具,可根据文字生成图像
一文读懂“多模态基础模型”
“女儿概念股”效应:多模态或成AI应用胜负手
必应聊天周报:图像生成工具Bing Image Creator、图谱卡片2.0等
英伟达发布最强图像生成器StyleGAN2,生成图像逼真到吓人
网址: 浪潮信息申请图像生成专利,提高文本图像模态转换的准确性 http://m.xishuta.com/newsview107511.html