1、Parler-TTS:完全开源的TTS
可以指定说话者的性别、语速、音调,模型数据集、预处理、训练代码、权重全部开源。目前只支持英文。
在线体验:https://huggingface.co/spaces/parler-tts/parler_tts_mini
Github:https://github.com/huggingface/parler-tts
2、RWKV发布v5和v6版本
非Transformer的LLM架构,目前还是很小众。
论文:https://arxiv.org/abs/2404.05892
模型:https://huggingface.co/RWKV
3、Meta宣布第二代芯片MTIAv2
5nm工艺,目前只能用于推理,说是未来也会用于训练(CUDA咋解决?)
官方博客:https://ai.meta.com/blog/next-generation-meta-training-inference-accelerator-AI-MTIA/
4、Stable Diffusion 生态论文精选
整理的非常细致,地址:https://latentbox.com/zh/sd-ecology
5、多语言LLM综述 梳理了多语言LLM相关论文、语料数据、排行榜,总结了多语言LLM发展现状。 论文:https://arxiv.org/abs/2404.04925