最新 最热

大语言模型质量评估

大语言模型质量评估 ! ✲ 大语言模型产品的评估系统 评估系统对大语言模型(LLM)产品的成

2024-04-01
1242

三种类型的专家混合模型 (Mixture of Experts, MoE) 简介

三种类型的专家混合模型 (Mixture of Experts, MoE) 简介 ! MoE 概述 MoE 使用稀疏的 MoE 层替换前馈

2024-04-01
2657

TextCraftor - 创新的文本编码器微调技术

TextCraftor - 创新的文本编码器微调技术 ! TextCraftor是一种创新的文本编码器微调技术,能够

2024-04-01
1237

AI21 Lab 新推出的 Mamba 架构和基于该架构的 Jamba 模型

AI21 Lab 新推出的 Mamba 架构和基于该架构的 Jamba 模型 ! AI21 Lab 推出了一种新的 LLM 架构 Mamba

2024-03-29
1028

X AI Grok-1.5 更新

X AI Grok-1.5 更新 ! X AI 发布了Grok-1.5更新,具有更好的推理能力及 128K 的上下文长度。昨天马

2024-03-29
1094

Databricks 新开源模型 DBRX

Databricks 新开源模型 DBRX ! Databricks 最近发布了新的强大开源模型 DBRX。该模型架构如下: -

2024-03-29
1022

LLM竞技场评分

LLM竞技场评分 ! LLM竞技场 ELO 机制评分下,Claude-3 Opus 正式超过了 GPT-4 的最新版本,成为最

2024-03-29
958

小米发布SDXS项目 - 提速SD图像生成

小米发布SDXS项目 - 提速SD图像生成 ! 小米也发布了一个大幅增强SD 图片生成速度的项目SDXS

2024-03-29
967

Claude Journalist - 一款强大的自动生成文章工具

Claude Journalist - 一款强大的自动生成文章工具 ! Claude Journalist 是一个非常不错的工具,只要

2024-03-29
1137

软件开发未来的思考 - Shesh

软件开发未来的思考 - Shesh ! 软件开发者 Shesh 对软件开发未来的思考有点意思,描述了为什

2024-03-29
919