阿里大模型M6原负责人杨红霞加盟字节跳动AI Lab,领导语言生成大模型研发

2023-03-23 13:12:31徐离维克
导读 【ITBEAR科技资讯】3月22日消息,阿里巴巴的语言生成大模型M6的原带头人杨红霞已加入字节跳动AI Lab,担任语言生成大模型的研发领导。杨

【ITBEAR科技资讯】3月22日消息,阿里巴巴的语言生成大模型M6的原带头人杨红霞已加入字节跳动AI Lab,担任语言生成大模型的研发领导。杨红霞在语言生成大模型团队中处于领导地位,直接向字节跳动副总裁杨震汇报。据公开资料,杨红霞在人工智能领域国际会议、顶级期刊有上百篇顶级论文。杨红霞离开阿里达摩院智能计算实验室是因为个人家庭原因。

据36氪报道,M6是国内首个千亿参数多模态大模型,其拥有多模态、多任务能力,在设计、写作、问答等方面表现突出,具有广泛的应用前景。M6于2021年3月首次发布,后来通过480块GPU更迭至万亿参数,并成功在10天内训练出10万亿模型,其参数规模与GPT-3相当,但能耗仅为其1%。M6的研发在国内外引起广泛关注和赞誉,其规模和设计都被认为非常惊人。

阿里巴巴技术副总裁贾扬清也宣布从阿里巴巴毕业,计划创业,关注包括大模型在内的AI应用。贾扬清是清华大学和加州大学伯克利分校的研究生,他在博士期间创立并开源了深度学习框架Caffe,被微软、雅虎、英伟达、Adobe等公司采用。据ITBEAR科技资讯了解,贾扬清计划创业的方向是AI基础设施提供商。

免责声明:本文由用户上传,如有侵权请联系删除!