1、OpenAI发布GPT-4-Turbo正式版
集成了视觉能力,不需要再单独调用GPT-4V的接口了,目前依旧是最强LLM接口,没有之一。
官方文档:https://platform.openai.com/docs/models/continuous-model-upgrades
2、Mistral发布Mixtral 8x22B模型
大概对应Mistral-Medium的水平。
模型地址:https://huggingface.co/mistral-community/Mixtral-8x22B-v0.1
3、谷歌开放Gemini pro 1.5 API
中文能力提升巨大,支持对语音的直接理解(不是语音转文字再理解),支持视觉能力,支持JSON结构输出,支持函数调用。可用性非常高。
官方博客:https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html
4、Suno的竞品:Udio
人声大幅优于Suno,一次性可以生成的时长更长。 目前免费,每月可以生成1200首歌,用的人太多生成功能维护中。 有竞争,用户就有更好的选择,好日子来了。