OpenAI为ChatGPT引入语音和图像功能
OpenAI 正在为 ChatGPT引入语音和图像功能。
OpenAI 在周一的博客文章中宣布,该平台——长期以来仅限于书面提示——将在未来两周内在ChatGPT应用程序的付费版本中添加新功能。
其他人“很快”就会收到这些功能。
你可以使用ChatGPT 的更新做什么?
用户可以与聊天机器人进行语音对话,使其更接近流行的人工智能助手,例如苹果的 Siri 和亚马逊的 Alexa。
ChatGPT 的新语音功能还可以讲述睡前故事、解决餐桌上的辩论以及大声说出用户输入的文本。
OpenAI 表示,Spotify 正在使用其背后技术,让该平台的播客将他们的内容翻译成不同语言。
用户还可以上传一张或多张图像到界面,并使用绘图工具突出显示图像的特定部分。
视觉功能可用于“排查烧烤炉无法启动的原因,探索冰箱中的物品来计划膳食,或分析复杂的图表以获取与工作相关的数据”。
人们的反应如何?
OpenAI在 X(此前名为推特)上进行的宣传上引起了一系列反响,虽然一些用户庆祝了新的更新,但其他用户却提出了担忧。
加州大学伯克利分校教授、Prompt AI 联合创始人特雷弗·达雷尔 (Trevor Darrell) 在接受《连线》采访时表示,对人工智能变得太像人类的恐惧被描述为“恐怖谷差距”。
虽然添加的功能可能会让聊天机器人感觉更自然,但一些研究表明,无法模仿人类交互的复杂界面可能会让人感觉很奇怪,这可能会使产品更难使用。
用户对最近针对 OpenAI 违反版权法和侵犯知识产权的诉讼表示担忧,建议其他人不要使用 ChatGPT。
其他人还提出了这些更新如何在未来取代小型人工智能初创公司、软件工程师甚至教育工作者的担忧。
人工智能生成的声音还引发了深度造假、语音诈骗和身份盗窃的威胁。
人工智能语音生成器的恶意使用正在增加,人工智能模仿真人的声音,给他们的亲戚打电话索要钱财。 McAfee 的一份报告显示,77% 的人工智能语音诈骗目标用户因此损失了钱财。
此外,英国诺丁汉大学研究人机交互的乔尔·费舍尔 (Joel Fischer)表示,语音识别的增加可能会使那些不讲主流口音的人更难使用该功能。
由于图像功能允许人工智能识别图像,因此,用户担心机器人或许能够绕过网站上的图像验证验证码测试。
这些测试要求用户通过转录扭曲的文本和识别图像来证明他们不是机器人,旨在限制访问。
最近的一项尚未经过同行评审的研究表明,人工智能机器人可以比人类更快、更准确地解决验证码测试。
ChatGPT 是否承认这些风险?
OpenAI 承认,新更新中的语音功能可能会导致恶意行为者进行欺诈和冒充,为了避免这种情况,该公司表示,正在“使用这项技术为特定用例提供支持”。
这恰好是与公司直接合作的配音演员创建的语音聊天。
OpenAI公司还承认在人工智能中使用图像的局限性,包括人工智能生成有关图像的错误信息的图像幻觉。
为了解决这个问题,OpenAI 已采取技术措施限制 ChatGPT 分析和直接发表有关人的言论的能力。