最新 最热

苹果发布MM1:30B规模多模态LLM

# 苹果发布MM1:30B规模多模态LLM ![Image](https://atts.gitsc

2024-03-29
744

Midjourney 官方时间线信息

Midjourney 官方时间线信息 ![Image](https://atts.gitschool

2024-03-28
661

[AI前沿] Stability AI 开源新版模型 - Stable Code Instruct 3B

# Stability AI 开源新版模型 - Stable Code Instruct 3B ![autoupl

2024-03-27
700

[AI前沿] ComfyUI-Cloud:云端运行工作流插件的优秀补充

# ComfyUI-Cloud:云端运行工作流插件的优秀补充 ![autoup

2024-03-26
757

[AI前沿] Domo新功能 - 提供视频和一张垫图生成新视频

# [AI前沿] Domo新功能 - 提供视频和一张垫图生成新视

2024-03-26
647

[AI前沿] SV3D - 图片转3D动画的神奇效果

# SV3D - 图片转3D动画的神奇效果 ![autoupload/SV3D - 图片

2024-03-26
637

[开源推荐] Champ - 基于3D的人物图片转视频动画项目

Champ是一个基于3D的人物图片转视频动画项目。它通过将原始视频和一张图片结合起来,让图片动起来。

2024-03-26
793

[AI产品] 越问 - 千亿参数(100B)的多模态大语言模型

阶跃星辰的公司新近进入了大语言模型的竞争中。他们发布了一个拥有千亿参数(100B)的多模态大语言模型,名为 **Step-1** ,并同时推出了对应的聊天机器人产品**跃问**与类似 **C AI** 的陪伴型应用**冒泡鸭**。

2024-03-26
681

[开源推荐] whisper - 音频转文字

推荐一个 whisper 音频转文字AI

2024-03-26
664

StreamingT2V - 一个可以生成超过 2 分钟长视频(1200 帧)的项目

StreamingT2V是一种先进的自回归技术,它能够从文本生成具有丰富动态特征的长视频,而不会出现视频停滞。这项技术确保视频在整个过程中保持时间上的一致性,紧密跟随描述性文本,并保持高帧级别的图像质量。

2024-03-25
827