阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

[复制链接]
查看5254 | 回复0 | 2025-1-30 01:52:09 | 显示全部楼层 |阅读模式
西风 梦晨 发自 凹非寺) ^/ D- r  n7 e
量子位 | 公众号 QbitAI
. I. b( L8 d/ \% O7 u  D+ y$ V( X( L
昨晚,杭州大模型又双叒不睡,给大伙儿 拜 年 啦~
& G) w5 `0 X4 i: W
就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹

0 `% t0 r3 z6 D* v
Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。

+ ?9 U- O! ?/ `" c) g9 g! c0 r( }5 V1 o* v: z
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-1.jpg

  U% n) h6 K' }, H& x7 e
Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准统统拿下,Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o,和Claude-3.5-Sonnet也能比一比。

  s* ]. I6 B5 F; @3 @' _
( W( C' m! Y* `( @1 L- a
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-2.jpg
: h6 ~$ S" L/ w2 ^, q
基座模型对比中,Qwen2.5-Max同样超越DeepSeek V3、Llama-3.1-405B,在针对模型知识理解和推理能力的MMLU-Pro等基准上均表现不凡。

- Y' ^$ v; K% g1 ?# m
  f  e! L0 ]% Q7 D; r$ X
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-3.jpg
% \. w; U3 D' p6 J& m
更令AI社区关注的是,Qwen2.5-Max同DeepSeek V3一样是超大规模的MoE模型,经超20万亿token的预训练数据及精心设计SFT+RLHF后训练方案训练而成。
8 M) l/ h) B5 D; r8 C: j
  E. S1 [  ~9 u( B' y/ B4 o  T
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-4.jpg

( P; o7 U  f% m7 Q% P: u. v' R# M
Qwen2.5-Max这份春节礼包被网友们齐刷刷收入囊中。前有DeepSeek,还有阿里通义Qwen,网友们不忘艾特奥特曼:

, W; V9 m1 }- ^' f
祝大家新年快乐,特别祝Sam。- ~! p; e+ n0 H& l) m# d
0 M1 u( \! {+ B
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-5.jpg

/ V  z4 N- E! @2 ^9 C. F
阿里研究员在模型发布后也都还不睡,纷纷当起了自个儿的自来水。

, M. s" A" V6 x* v4 I" N6 Y! Z
阿里高级算法专家林俊旸开麦:
$ a! t. W7 }; p0 z3 f! C
Qwen2.5-Max在基准测试中表现良好,希望大家可以试试看,新年快乐!
8 O5 X+ c2 I3 m% v& ?" m
9 `+ X# E  u3 t0 s6 Z+ {& l
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-6.jpg

. J1 w0 X7 o2 s3 u2 D
之前曾自曝阿里大模型员工996作息表的Binyuan Hui也再次现身:
" O' o$ U; N5 b/ J5 K, R4 U) U
外面的烟花照亮了天空,我却坐在电脑跟前。
/ A: o! H7 \4 c% O1 i, U3 \6 e

2 |& Y3 U. L! a% `) J( r! \
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-7.jpg
* H# u7 [# ]3 t/ o* j  R: \) D
多模态能力展示8 E/ N' {. {: J2 {0 c# X6 d: J  @

1 n7 j0 Q$ v* L, c# g( d. k4 [% C
下面是Qwen2.5-Max在四个使用场景上的演示。

* S9 y* K7 m4 Y9 \
首先是联网搜索功能,输出的每句话来源出处都有标注,整体运行也很丝滑。
! J- y% V6 _. B6 e, ?7 ~

1 q5 W& q) V- W
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-8.jpg
6 v" |; x! M: p% b/ g. v6 m
代码能力上,Qwen2.5-Max能够帮助用户完成各种可视化创作,一句话就能做出下面这样旋转的球体:

% ^" v5 l: d) k2 n- D
& G+ q( C$ Y. t/ G
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-9.jpg
0 e* N0 ^* c; q# y: d/ k/ H
有网友改造了一下,让球体内部有三个弹跳的黄色小球。
1 O* u* u" v* l9 u% j# A

2 f1 |3 [# }0 i- u6 C* K9 M6 h
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-10.jpg

  ?8 Q! a0 W- b$ L. X
结果只尝试了一次就成功了,而且三个小球始终在大球内部运动,能正确处理碰撞:

2 I! l3 b8 ]! G. t/ p4 J" V  w% `8 I0 S" l- A
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-11.jpg
8 s0 W2 s/ z: t
Qwen2.5-Max也有Artifacts功能,同样一句话,能开发各种小应用、小游戏

# S: R- d$ P  r. v+ v4 w% {
比如制作一个扫雷小游戏,秒秒钟“啪”一下直接就能玩:
. o, v: F/ c1 ~2 L* B

- C  A, F. h) _/ Z+ I2 Q* r6 C
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-12.jpg
+ m) |3 g& z- h/ y7 i; ^4 o& P* M
另外Qwen2.5-Max数单词中的特定字母数量也不在话下。

# z; A" B( j! Z6 {- q1 x/ H& h- W4 b( [
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-13.jpg

5 F8 \% M( E% y$ h* O1 R6 k3 n
现在,Qwen2.5-Max已在Qwen Chat中上线。

$ _& B- p: A/ E7 o+ V& S1 w$ f( a
此外也有Hugging Face的Demo可玩,还上线了Any Chat,并且可通过阿里云服务使用API。
& M1 j% L9 t; ^$ T  K9 p

' U( K; q" l( @# w! ~1 E
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏-14.jpg

1 ~/ R/ L- X. ^
兴趣的童鞋赶紧试试吧~
$ ^! j4 H/ O5 `; |. Q$ S5 b
参考链接:
- W) F  P7 e4 ^: g. r$ I[1]https://qwenlm.github.io/blog/qwen2.5-max/, r- F  X) K* w1 X
[2]https://x.com/JustinLin610/status/1884263803451498794
5 t( L7 x. A) ~1 v3 H[3]https://x.com/_akhaliq/status/1884278071093502253  `1 }# U0 ?  a6 v6 Q  ?: u9 X% W
[4]https://x.com/huybery/status/1884263539675934860
$ {$ `5 }* R0 ^) s1 Q
— 完 —
( [  j. I' A3 R; x' C- V量子位 QbitAI · 头条号签约. {$ A) |- D6 R9 c
关注我们,第一时间获知前沿科技动态
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

291

金钱

0

收听

0

听众
性别

新手上路

金钱
291 元