消息称 OpenAI 将推出多模态人工智能数字助理

爱评测
2024
05/13
22:33
IT之家
分享
评论

来源:IT之家 

据 The Information 报道,OpenAI 最近向部分客户展示了一款新型多模态人工智能模型,该模型能够进行语音对话和物体识别。有消息人士透露,这或许就是 OpenAI 计划在即将到来的 5 月 13 日正式发布的内容之一。

图源 Pexels

报道称,相比于 OpenAI 现有的独立图像识别和文本转语音模型,该新型模型能够更快、更准确地处理图像和音频信息。例如,它可以帮助客服人员 " 更好地理解来电者的语气语调,判断他们是否在使用讽刺语气 "。理论上,该模型还能辅助学生学习数学知识,或翻译现实世界中的标志文字。

不过,消息人士也指出,虽然该模型在某些问题解答方面能够超越 GPT-4 Turbo,但仍有可能出现自信地给出错误答案的情况。

IT 之家注意到,开发者 Ananay Arora 发布了一张包含通话相关代码的截图,暗示 OpenAI 可能正在为 ChatGPT 加入打电话的功能。Arora 还发现了一些证据表明 OpenAI 正在配置用于实时音视频通信的服务器。

OpenAI 首席执行官萨姆阿尔特曼 ( Sam Altman ) 已经明确否认即将发布的新品是代号为 GPT-5 的大型语言模型(据称其性能将大幅优于 GPT-4)。The Information 则表示,GPT-5 可能将在今年年底前正式亮相。阿尔特曼还表示,OpenAI 不会发布新的人工智能搜索引擎。

如果 The Information 的报道属实,OpenAI 的新品发布仍可能会对即将举行的 Google I / O 开发者大会产生一定影响。众所周知,谷歌也在测试利用人工智能进行电话呼叫的技术。此外,谷歌还有一个据传即将发布的项目,代号为 "Pixie"。Pixie 是一款能够通过设备摄像头识别物体的多模态 Google Assistant 替代品,可以为用户提供诸如 " 如何前往购买地点 " 或 " 如何使用 " 等信息。

THE END
广告、内容合作请点击这里 寻求合作
互联网
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

蔚来旗下乐道 官方网站今日正式上线,显示 " 首款车型 L60 敬请期待 "。
快讯
特斯拉近日透露,Cybertruck 的前备箱使用了 " 学习算法 " 来进行防夹检测,这解释了为何在一些测试中会出现不一致的结果。
快讯
根据市场调查机构 Counterpoint Research 近日发布的报告,2024 年第 1 季度全球个人电脑(PC)出货量同比增长 3%,在连续下跌 8 个季度之后首次实现正增长。
评测
小米 的 " 固定环节 " 每日答网友问今日继续,此次的问题主要围绕日常用车,亦对部分传闻进行否认。
快讯
全新一汽大众迈腾车型有望于 5 月 21 日上市,这款车型将搭载大疆智驾方案,提供 1.5T 动力和 2.0T 动力可选,作为参考,目前在售的迈腾售价区间为 18.69 万 -25.39 万元。
快讯

相关推荐

1
3
Baidu
map