家长们哄娃睡觉变得so easy。
当“要求讲一个”睡前故事时,GPT-4o在讲故事时的语音语调更跌宕起伏,更为声情并茂,甚至可以以唱歌的形式结束对话。
家长辅导孩子写作业也变得更轻松。
GPT-4o 还拥有视觉+语音交互功能,能够看图解方程式。操作者打开手机视频通话,对GPT-4o说:“我要在一张纸上写下一个线性方程。不要告诉我答案,只是给出解答它的过程。”随后,操作者写下了3x+1=4的方程式,询问如何解这道题。GPT-4o通过循循善诱的提示,在Zoph提出求助与问题时不断给出下一个步骤的建议,从而得出了x=1的正确结果。
以前GPT-3.5和GPT-4用户以语音模式Voice Mode与ChatGPT对话的平均延迟时间为2.8秒和5.4秒,因为用了三个独立的模型实现这类对话:一个模型将音频转录为文本,一个模型接收并输出文本,再有一个模型将该文本转换回音频。这个过程意味着,GPT丢失了大量信息,它无法直接观察音调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。
而GPT-4o的语音对话是OpenAI跨文本、视觉和音频端到端训练一个新模型的产物,这意味着所有输入和输出都由同一神经网络处理。OpenAI称,GPT-4o是其第一个结合所有这些模式的模型,因此仍然只是浅尝辄止地探索该模型的功能及其局限性。
———————————————————————————————————————
除了OpenAI,全球科技巨头将密集公布AI领域最新进展:
5月14日,谷歌召开I/O开发者大会2024,安卓、谷歌搜索将迎来更新;
5月21日,微软将举行Build年度开发者大会,聚焦AI和Copilot;
6月10日,苹果或将在全球开发者大会上推出引入大语言模型的Siri语音助手。
AI科技板块沉寂了近2个月,期间黄金有色、石油化工、低空经济、合成生物等轮番表现,现在都已经审美疲劳,而充分调整的AI面临一系列重量级产品或服务的面世,将再度成为市场的主流。
全部讨论
5月14日就判断AI等科技板块卷土重来。到了今天,在美股的引领下,科技板块再起的迹象越来越明显。
今日,小金属、贵金属、煤炭石油等高开低走,享受了A股特有的e心走势,资金进一步流出;高速铜连接、光模块、AI应用、半导体等资金流入。
神宇股份、罗博特科等受益于AI基建的小盘股,是短线的先锋;工业富联、中际旭创是AI基建的中军,步步为营,重装出击。
除了以外,房地产受益于政府亲自下场收储,信心大增,万科这种大盘股都大涨5%,滨江集团直接涨停。房地产稳,经济就稳,后市无忧。
$中际旭创(SZ300308)$ $创业板指(SZ399006)$ $英伟达(NVDA)$
ai的变革才刚开始,未来硬件软件都会有很多投资机会。