毕业论文
您现在的位置: 语言识别 >> 语言识别市场 >> 正文 >> 正文

Chatgpt新增语音和图片识别功能

来源:语言识别 时间:2024/8/30

能想象得出吗?你用装有CHATGPT应用程序的手机,拍摄冰箱内留存的食物,这个程序就能根据现有食材,能给你自动生成健康的食谱和制作方法。真的吗?答案是肯定的。据9月27日VOA报道,人工智能(AI)工具ChatGPT已经增加了新的功能,包括语音和图像识别。

这些变化允许一些用户直接向ChatGPT提问,并获得语音回答。此外,该工具还能识别图像,并提供关于图像内容的信息。

ChatGPT的创建者OpenA于I本周宣布了这个工具的最新升级。目前,新的语音和图像升级仅适用于ChatGPT的Plus和Enterprise服务的用户。

ChatGPT是一个聊天机器人,是一种由计算机驱动的工具,旨在与人类进行流畅互动并进行高水平的写作。这项技术也被称为“生成式AI”。

ChatGPT的主要服务称为GPT-3.5,对所有用户免费。ChatGPTPlus的费用为每月20美元。Enterprise服务适用于个别公司,费用与企业使用的服务相关联。

OpenAI公司解释说,ChatGPTPlus和Enterprise用户将能够在接下来的两周内使用这些语音和图像功能。升级后的工具将很快提供给其他用户群体,包括开发人员。语音和图像升级也将很快添加到使用iOS和Android系统的设备中。

该公司表示,ChatGPT的新语音控制旨在为用户提供一种自然的与AI工具交流的方式,类似与人交谈。但它指出,这个聊天机器人不仅可以回答问题,还可以给孩子讲故事或提供制作或建造某物的详细说明。

用户可以选择他们希望聊天机器人使用的不同语音。公司表示,他们与专业的声音演员密切合作,以使互动更加逼真和个性化。

ChatGPT升级的语音交互功能已经存在于许多语音助手系统中,包括亚马逊的Alexa、Alphabet的Google助手、苹果的Siri等。美国软件制造商微软今年早些时候将语音控制功能添加到了基于ChatGPT的Bing搜索引擎中。

ChatGPT工具的另一个显着变化是图像识别。这允许用户上传照片到系统中,然后获取有关照片中包含的内容的信息。

例如,公司表示,用户可以拍摄他们冰箱中目前有什么食物的照片。将照片输入ChatGPT后,该工具可以根据用户所拥有的食材建议晚餐可能的选择。系统还可以提供制作这顿饭的逐步说明。

带给用户的另一个惊喜是,家长可以拍摄孩子的数学问题照片,然后寻求如何向孩子解释如何解决这个问题的建议。用户甚至可以标记图像的特定区域(例如用圆圈),以获取更具体的信息或关于该元素的帮助。

除了宣布这一消息,OpenAI还提醒其ChatGPT工具可能很容易出错。它指出,由于系统是通过大量公开可用的信息进行训练的,因此可能会返回虚假、过时或具有歧视性的结果。

公司敦促所有用户注意虚假信息,并尽力核实由聊天机器人提供的信息。

OpenAI宣布,其AI技术还被数字音乐服务Spotify公司使用。ChatGPT被用来驱动一个系统,允许Spotify的播客制作者将他们的节目翻译成不同的语言。OpenAI表示,这些翻译是用播客制作者自己的声音完成的,以使它们听起来更加自然。

Spotify公司表示,未来几周将首次添加的语言将是西班牙语、法语和德语。

转载请注明:http://www.0431gb208.com/sjszlff/7418.html