大家好,今天咱们来扒一扒大语言模型厂商。
现在动不动就听说"某某模型又升级了",什么 GPT、Claude、通义千问、文心一言... 名字一大堆,到底都是谁家的?谁开源谁闭源?命名有啥规律?
一篇文章给你讲清楚。
先说个概念:啥是"大语言模型"?
简单说,就是能理解人类语言、能对话、能写东西的 AI。
你可以把它想象成一个读过全世界书的超级学霸,你问它啥它都能聊两句。
国内厂商
1️⃣ 阿里巴巴 —— 通义千问
-
模型名:Qwen(通义千问的英文名)
-
命名规则:Qwen + 数字,如 Qwen2、Qwen2.5、Qwen3
-
开源情况:部分开源 👍
-
小尺寸模型开源,可以免费下载使用
-
最强版本闭源,只能通过阿里云调用
-
特点:国内开源做得最好的,能力强,生态大
一句话:阿里是"开源派",愿意把模型分享给大家。
2️⃣ 百度 —— 文心一言
-
模型名:ERNIE Bot(文心一言的英文名)
-
命名规则:ERNIE + 数字,如 ERNIE Bot 4.0、4.5
-
开源情况:基本闭源 🔒
-
主要通过百度智能云提供服务
-
开源较少
-
特点:国内最早做大模型的,中文理解能力强
一句话:百度是"保守派",模型主要自己用。
3️⃣ 腾讯 —— 混元
-
模型名:HunYuan(混元)
-
命名规则:HunYuan + 功能后缀,如 HunYuan-DiT(画图)、HunYuan-Voice(语音)
-
开源情况:部分开源 👍
-
一些垂直领域模型开源
-
特点:跟腾讯业务结合深,微信、广告都在用
一句话:腾讯是"务实派",模型主要服务自家业务。
4️⃣ 字节跳动 —— 豆包
-
模型名:Doubao(豆包)、ByteDance-LLM
-
命名规则:直接用产品名"豆包"
-
开源情况:部分开源 👍
-
开源了一些模型,如 Skywork 系列有合作
-
特点:C 端产品做得好,豆包 APP 很多人用
一句话:字节是"产品派",模型直接面向普通用户。
5️⃣ 月之暗面 —— Kimi
-
模型名:Moonshot(月之暗面公司)、Kimi(产品名)
-
命名规则:直接用 Kimi
-
开源情况:闭源 🔒
-
特点:长文本处理能力强,能读几十万字的文档
-
背景:创业公司,但融资超多,发展快
一句话:Kimi 是"长文本之王",读大文件找它。
6️⃣ 智谱 AI —— GLM
-
模型名:GLM(Generalized Language Model)
-
命名规则:GLM + 数字,如 GLM-4、GLM-Edge
-
开源情况:部分开源 👍
-
ChatGLM 系列开源,很受欢迎
-
特点:清华背景,技术实力强,开源友好
一句话:智谱是"学院派",技术扎实还愿意分享。
国外厂商
1️⃣ OpenAI —— GPT 系列
-
模型名:GPT(Generative Pre-trained Transformer)
-
命名规则:GPT + 数字,如 GPT-3.5、GPT-4、GPT-4o
-
"o" 代表"omni"(全能),能处理文字、图片、声音
-
开源情况:完全闭源 🔒🔒
-
最强模型,但只能通过官网或 API 使用
-
地位:行业老大,带火了整个大模型浪潮
-
产品:ChatGPT
一句话:OpenAI 是"领头羊",最强但最封闭。
2️⃣ Anthropic —— Claude 系列
-
模型名:Claude
-
命名规则:Claude + 版本,如 Claude 2、Claude 3、Claude 3.5
-
3.5 后面还有"Sonnet"、"Opus"等代号(Sonnet 中等,Opus 最强)
-
开源情况:完全闭源 🔒
-
特点:安全性高,输出质量稳定,写代码强
-
背景:从 OpenAI 出来的人创办的
一句话:Claude 是"优等生",安全可靠,写作能力强。
3️⃣ Google —— Gemini 系列
-
模型名:Gemini(双子星)
-
命名规则:Gemini + 尺寸,如 Gemini Nano(小)、Pro(中)、Ultra(大)
-
开源情况:部分开源 👍
-
有些版本开源,有些闭源
-
特点:谷歌亲儿子,跟搜索、安卓深度整合
-
前身:以前叫 PaLM,后来改名 Gemini
一句话:Gemini 是"谷歌亲儿子",生态整合好。
4️⃣ Meta —— Llama 系列
-
模型名:Llama(羊驼🦙)
-
命名规则:Llama + 数字,如 Llama 2、Llama 3、Llama 3.1
-
开源情况:大力开源 👍👍👍
-
几乎所有版本都开源,可以免费下载
-
开源界的老大哥
-
特点:开源模型里最强的之一,社区生态极大
-
产品:没有直接面向消费者的产品,主要给开发者用
一句话:Meta 是"开源之王",免费给大家用。
5️⃣ Mistral —— 法国小钢炮
-
模型名:Mistral、Mixtral
-
命名规则:Mistral + 尺寸,如 Mistral 7B、Mixtral 8x7B
-
开源情况:部分开源 👍
-
特点:欧洲公司,模型小巧但能力强
-
背景:创业公司,融资快,发展猛
一句话:Mistral 是"欧洲之光",小模型大能量。
📊 开源 vs 闭源,啥区别?
| 开源 | 闭源 |
|---|---|
| 代码和模型公开,可以免费下载 | 不公开,只能用官方 API |
| 可以自己部署、修改 | 只能用厂商提供的服务 |
| 适合开发者、研究者 | 适合普通用户、企业 |
| 例子:Llama、Qwen | 例子:GPT-4、Claude |
简单理解:
-
开源 = 免费食谱,你可以自己做饭
-
闭源 = 去餐厅吃,付钱就行但不能偷师
🔠 命名规则有啥规律?
看多了你会发现,模型命名就这几套:
1. 数字迭代型
-
GPT-3 → GPT-4 → GPT-4o
-
Llama 2 → Llama 3
-
Qwen2 → Qwen2.5 → Qwen3
-
规律:数字越大越强
2. 尺寸分级型
-
Gemini Nano / Pro / Ultra
-
Claude Haiku / Sonnet / Opus(小/中/大)
-
规律:名字越"大",模型越强
3. 产品直用型
-
Kimi、豆包、文心一言
-
规律:直接用产品名,好记
📋 一张表总结
| 厂商 | 模型 | 开源情况 | 特点 |
|---|---|---|---|
| OpenAI | GPT | 🔒 闭源 | 行业最强 |
| Anthropic | Claude | 🔒 闭源 | 安全、代码强 |
| Gemini | 👍 部分开源 | 生态整合好 | |
| Meta | Llama | 👍👍 大力开源 | 开源首选 |
| 阿里 | Qwen | 👍 部分开源 | 国内开源最好 |
🎯 最后给点建议
普通用户:直接用产品就行
-
想体验最强 → ChatGPT、Claude
-
国内用户 → Kimi、豆包、通义千问
开发者/研究者:
-
想自己折腾 → Llama、Qwen(开源)
-
想调 API → 看哪家便宜用哪家
企业:
-
要稳定 → 选大厂闭源模型
-
要可控 → 选开源模型自己部署
好了,今天的大模型厂商大盘点就到这。
模型更新快,今天的最强明天可能就过时了。但记住一点:选适合自己的,别盲目追新。
下期见!👋
