GPT-4o会干掉一大批创业公司

发布于: 雪球转发:0回复:0喜欢:1

新一代旗舰模型发布后,可以确认的说《HER》来了(没看过的人赶紧去看),在行业角度看,开源vs免费将成为未来一个重要的竞争趋势——MetaGoogle,xAI们用开源追赶GPT-4,OpenAI则是免费次级旗舰模型,直接服务99%的大众用户。

1. 这次的4o最大的产品亮点的交互方式,语音交互从原来的5秒到现在300毫秒(与人类交互接近),直接打开了交互助手类广阔市场,加上图像文本语音双向交互,过去做情感陪伴类的创业公司(如Hume等)以及同声传译行业(包括硬件)基本可以退场了

2. 技术上4o最大亮点是语音的端到端输入输出,过去的语音交互为啥慢到不可用,因为要尊重——“语音转文字→文字到模型模型→输出文字→文字到语音”的流程,4o则是语音到语音放在一个模型里,一步完成,像不像特斯拉FSDV12?

3. 虽然以创业公司形式会被4o干翻,但对个人开发者会是利好,语音交与类应用会大肆爆发,娱乐类产品会是第一个killer app,只能说,《HER》真的来了,你做好准了吗?

4. 没对象的别着急,可能今年你就会发现,真人也就那么回事,还是AI香,具身智能的躯体一旦刚拿上模型的速度,必然也会影响时物理世界的情感关系。

5. Google 坐实了AI届汪峰,估计看完都麻了,今晚的 I/O 大会咋整?

整体概要一下发布会:

GPT-4进化为GPT4o全能模型,ChatGPT进入桌面应用时代

1. 一体化能力: 将语音、文本和视觉集成到一个模型中。

2. 增强交互:实时对话能力、宽广的声音范围,包括唱歌!

3. 速度和效率: 明显降低所有服务的延迟。

4. 全球覆盖: 现支持超过50种语言,覆盖全球97%的人口。

5. 便捷性:免费提供,但有使用限制。

API改进:

6. 性能提升: 响应时间加快2倍。

7. 降低成本:价格减半。

8. 提升容量:GPT4-Turbo的使用率限制提高5倍。

现场演示部分:这里建议去看看25分钟发布会实录,具体内容:

1. 通过移动应用实时进行基本对话的语音演示。

2. 移动应用通过实时视觉解决数学问题。

3. ChatGPT桌面应用在编码和情节分析中表现出色。

4. 移动应用实时语音翻译和面部情绪识别。