首页 > 科技快讯 > OpenAI 自我“揭短”：论文揭示 GPT-4V 仍有缺陷！

OpenAI 自我“揭短”：论文揭示 GPT-4V 仍有缺陷！

晰数塔互联网快讯
2023-09-29 17:56

【CSDN 编者按】自三月份 OpenAI 宣传了 GPT-4 的多模态性后，却迟迟没有公开模型的图像功能，据报道是因为对于滥用和隐私隐患。在最近 OpenAI 公布的论文中，也揭示了这其中的一些问题。

原文链接：https://techcrunch.com/2023/09/26/openais-gpt-4-with-vision-still-has-flaws-paper-reveals/

作者 | Kyle Wiggers 译者｜Ric Guan

责编 | 郑丽媛

出品 | CSDN（ID：CSDNnews）

当 OpenAI 在今年 3 月首次推出旗舰文本生成人工智能模型 GPT-4 时，该公司大力宣传该模型的多模态性，其中最引人关注的便是，它能够理解图像和文本的上下文。OpenAI 表示，GPT-4 可以为相对复杂的图像添加字幕，甚至进行解释，例如可以识别 iPhone 充电口插入了一个 VGA 连接器。

但时间过去了 6 个月，OpenAI 一直未公开该模型的图像功能，对此有报道称，OpenAI 是出于对滥用和隐私问题的担忧才迟迟未面向更广泛的用户测试此功能。然而，一直以来，官方没有正面回应。

直到本周早些时候，OpenAI 发表了一篇关于 GPT-4 的论文：GPT-4V（ision）系统卡（https://cdn.openai.com/papers/GPTV_System_Card.pdf），其中详细描述了 OpenAI 如何为 GPT-4 部署视觉功能，并解释了延缓 GPT-4 图像分析功能发布的原因，以及背后所做的工作。

迄今为止，具有视觉功能的 GPT-4（OpenAI 内部缩写为“GPT-4V”）仅被 Be My Eyes（一款帮助弱视和盲人导航周围环境的应用程序）的数千名用户定期使用。然而，据该论文称，在过去的几个月里，OpenAI 也开始与“红队成员”合作，调查该模型是否存在意外行为的迹象。

在论文中，OpenAI 声称它已经采取了保障措施来防止 GPT-4V 被恶意使用，比如破解验证码（许多网络表格中的反垃圾邮件工具）、识别人员身份或估计其年龄或种族，以及根据照片中不存在的信息得出结论。OpenAI 还表示，它一直在努力遏制 GPT-4V 生成有害的偏见，特别是那些与人的外貌、性别或种族有关的偏见。

但与所有人工智能模型一样，防护措施能做的也有限。

论文显示，GPT-4V 有时难以做出正确的推断，例如错误地将图像中的两串文字组合成一个虚构的术语。与基础 GPT-4 一样，GPT-4V 也容易产生幻觉，或以权威的口吻捏造事实。此外，它还会遗漏文字或字符、忽略数学符号，以及无法识别相当明显的物体和场所设置。