微软称将在下周推出多模态的GPT-4 可能会支持图像/语音/视频等
有关 GPT-4 何时发布一直有各种传言,之前有传言称 GPT-4 将包含 1 万亿个参数,而 GPT-3 则是 1750 亿参数。对于传言 OPENAI 首席执行官 Sam Altman 否认并且表示他们还没有真正的 AGI,团队期望能搞定 AGI,但这还需要更多时间。
AGI 指的是通用人工智能,意思是在许多领域至少具有与人类相当的能力。就目前 ChatGPT 来说还做不到这一点,所以 Sam Altman 说还他们还没有真正的 AGI。
另外目前 ChatGPT 和 Bing Chat 都只支持文本交互,这个并不能满足用户的需求,所以微软提前透露了多模态的 GPT-4。
微软德国首席技术官表示,微软将在下周推出 GPT-4。拥有多模态模型,提供完全不同的服务可能性,例如视频。
理想状态下从微软这描述来看,GPT-4 应该广泛支持视频、图像和语音交互,而不是只能输入文本进行交互,当然通过文本交互已经需要消耗巨大的算力,如果支持视频、图像的话这算力估计还要提升一个数量级。
到时候 ChatGPT 或 Bing Chat 或许有能力生成图像和视频,至少从用户角度来说这是个巨大的好消息。
另外还有传闻称 OPENAI 正在制作官方版的 ChatGPT 手机版,使用 GPT-4 而非现在的 GPT-3.5,估计 ChatGPT 手机版到时候也能制作视频。