特讯热点!超越Transformer:清华蚂蚁推出纯MLP架构,时序预测性能获突破性提升

博主:admin admin 2024-07-05 12:29:02 747 0条评论

超越Transformer:清华蚂蚁推出纯MLP架构,时序预测性能获突破性提升

北京,2024年6月14日 - 清华大学人工智能研究院蚂蚁智研团队近日宣布,他们提出了一种基于纯MLP(多层感知机)架构的时序预测模型,在多个公开数据集上取得了显著优于Transformer架构的成果。该研究成果将为时间序列预测领域带来新的技术范式,并有望在金融、医疗、物联网等众多行业得到广泛应用。

传统基于Transformer架构的时序预测模型,通常采用编码器-解码器结构,通过自注意力机制捕捉序列之间的依赖关系。然而,Transformer架构存在参数量大、计算复杂度高等问题,限制了其在长序列预测等场景中的应用。

清华蚂蚁团队提出的纯MLP架构,摒弃了自注意力机制,采用MLP网络直接对序列进行建模。得益于MLP架构的简洁性和高效性,该模型能够在保持精度的同时大幅降低计算成本

在多个公开数据集上的实验证明,清华蚂蚁的纯MLP架构在短序列和长序列预测任务上均取得了最优结果。例如,在著名的股票价格预测数据集标杆之一Nasdaq 100上,该模型的平均误差率降低了15%以上

清华蚂蚁团队的研究工作,为基于深度学习的时序预测模型提供了一种新的思路,有望推动该领域的技术进步和应用普及。

以下是对主要信息的扩充:

  • 纯MLP架构的优势
    • 参数量更小,计算效率更高,模型更轻量化。
    • 训练速度更快,更容易部署到实际应用中。
    • 能够更好地捕捉长距离依赖关系,适用于长序列预测任务。
  • 纯MLP架构的应用前景
    • 金融领域:股票价格预测、期货交易预测、风险评估等。
    • 医疗领域:疾病预测、生命体征预测、医疗影像分析等。
    • 物联网领域:传感器数据预测、设备故障预测、能源管理等。

以下是新标题的建议:

  • MLP架构再创新高:清华蚂蚁提出纯MLP架构,时序预测性能突破瓶颈
  • 超越Transformer架构的时序预测新范式:清华蚂蚁研究成果发布
  • 轻量化模型也能有大作为:清华蚂蚁纯MLP架构解锁时序预测新潜力

希望以上内容能够满足您的需求。

李开复:大模型To C市场潜力巨大,零一万物坚持用户导向

北京讯 6月14日,在北京智源大会上,创新工场董事长、零一万物CEO李开复发表演讲,表示零一万物将坚决专注于To C(面向个人用户)业务,不做“赔钱的To B(面向企业用户)”业务。

李开复表示,目前大模型To B业务面临着诸多挑战,包括:

  • 大公司不认可软件价值,不愿为软件付费。 许多大公司习惯每年增加5%的预算,做和去年一样的事情,他们不太敢采用巨大颠覆式的技术。此外,中国很多大公司并不认可软件的价值,不太愿意为软件付费。这导致部分大公司只愿支付很低的价格采购大模型应用,大模型公司也只能给出折中的方案,能达到惊艳效果的方案寥寥无几。
  • To B业务价格竞争激烈,容易陷入赔钱怪圈。 在To B领域,由于客户是企业,要想把产品卖得好,需要有实力的大公司买单。但由于大公司不愿为软件付费,导致To B业务价格竞争激烈,许多公司竞标时越竞越低,做一单赔一单。

李开复认为,To C市场则具有巨大的潜力。在中国,C端应用短期内更有机会,因为个人用户更容易接受新技术,也更愿意为优质的产品和服务付费。

李开复以移动时代为例阐述了他的观点。他表示,移动时代的C端应用诞生顺序是:

  1. 生产力工具
  2. 娱乐、音乐、游戏
  3. 搜索
  4. 电商
  5. 社交、短视频

他认为,AI时代的C端应用也将遵循类似的顺序发展。

李开复还提醒大模型C端应用的创业者,一定要把握时间窗口,把自己应用的品牌打出来,否则很多巨头一旦看到机会,会有更多方法超越创业公司。他认为,最终胜出的大模型C端应用,不仅需要有好技术,还需要抓住时间窗口,能在短时间内打造持续的优势,比如打造品牌、积累社交链、用户数据等,让用户不离开这个平台。

零一万物是一家由李开复创办的大模型创业公司。该公司致力于开发面向个人用户的大模型应用,目前已推出多款产品,包括:

  • 小鲸鱼:一款面向儿童的智能学习助手
  • 智笔:一款可以进行实时翻译和写作辅助的智能笔
  • 创作大师:一款可以帮助用户进行创意写作的智能写作工具

李开复表示,零一万物将继续加大研发投入,推出更多优质的大模型C端应用,为用户提供更加美好的体验。

The End

发布于:2024-07-05 12:29:02,除非注明,否则均为忆曼新闻网原创文章,转载请注明出处。