OpenAI 宣布 ChatGPT 即将“看、听、说”

2023-09-26 10:56

免责声明 免责声明:内容来源于网络收集,不构成任何投资建议!

包括语音识别和文本转语音功能在内的新功能将在未来两周内推出。

OpenAI 宣布 ChatGPT 即将“看、听、说”

根据OpenAI 9 月25 日的公告,ChatGPT 很快将提供新功能,允许用户通过图像和语音识别与其进行交互。

OpenAI 宣布用户将能够使用语音命令与ChatGPT 进行交互,从而获得更加个性化的用户体验。该公司表示,该功能由文本转语音模型提供支持,该模型根据专业配音演员创建的最小样本语音生成音频。该公司表示,该功能还由其开源语音识别系统Whisper 提供支持。

语音功能预计将提供更广泛的用例,例如协助阅读睡前故事、创建食谱、撰写演讲、背诵诗歌、解释常用短语,甚至解决“餐桌辩论”等任务。

OpenAI 补充说,用户很快将能够向ChatGPT 提供图像(或图像的选择部分)以进行解释和响应。

OpenAI 承认风险

OpenAI 承认存在欺诈和假冒风险,并表示正在相应限制其语音聊天平台的语音功能。它强调它使用专业配音演员——而不是用户的声音——来输出音频。 OpenAI 补充说,某些其他群体可以将语音功能用于其他目的;例如,Spotify 正在将参与的播客翻译成新语言,并使用每位主持人的原始声音。

该公司指出图像识别会带来隐私风险,并表示作为回应,它限制了ChatGPT 发表有关人物的声明的能力。它指出ChatGPT“并不总是准确”,但表示对图像的一般描述可能有用,并引用了其早期与Be My Eyes 的合作,Be My Eyes 是一款针对盲人和弱视人士的应用程序。

OpenAI 表示将在未来两周内向ChatGPT Plus 和Enterprise 引入语音和图像功能。该公司表示,语音功能将在iOS 和Android 上提供(选择加入),图像功能将在所有平台上提供。