最新 最热

大语言模型质量评估

大语言模型质量评估 ! ✲ 大语言模型产品的评估系统 评估系统对大语言模型(LLM)产品的成

2024-04-01
867

三种类型的专家混合模型 (Mixture of Experts, MoE) 简介

三种类型的专家混合模型 (Mixture of Experts, MoE) 简介 ! MoE 概述 MoE 使用稀疏的 MoE 层替换前馈

2024-04-01
1900

TextCraftor - 创新的文本编码器微调技术

TextCraftor - 创新的文本编码器微调技术 ! TextCraftor是一种创新的文本编码器微调技术,能够

2024-04-01
848

AI21 Lab 新推出的 Mamba 架构和基于该架构的 Jamba 模型

AI21 Lab 新推出的 Mamba 架构和基于该架构的 Jamba 模型 ! AI21 Lab 推出了一种新的 LLM 架构 Mamba

2024-03-29
718

X AI Grok-1.5 更新

X AI Grok-1.5 更新 ! X AI 发布了Grok-1.5更新,具有更好的推理能力及 128K 的上下文长度。昨天马

2024-03-29
726

Databricks 新开源模型 DBRX

Databricks 新开源模型 DBRX ! Databricks 最近发布了新的强大开源模型 DBRX。该模型架构如下: -

2024-03-29
661

LLM竞技场评分

LLM竞技场评分 ! LLM竞技场 ELO 机制评分下,Claude-3 Opus 正式超过了 GPT-4 的最新版本,成为最

2024-03-29
638

小米发布SDXS项目 - 提速SD图像生成

小米发布SDXS项目 - 提速SD图像生成 ! 小米也发布了一个大幅增强SD 图片生成速度的项目SDXS

2024-03-29
644

Claude Journalist - 一款强大的自动生成文章工具

Claude Journalist - 一款强大的自动生成文章工具 ! Claude Journalist 是一个非常不错的工具,只要

2024-03-29
760

StreamingT2V - 高效生成长视频项目

StreamingT2V - 高效生成长视频项目 ! StreamingT2V一个可以生成超过 2 分钟长视频(1200 帧)的项

2024-03-29
674