当前位置:CRM > 互联网资讯

互联网资讯

  • 最新
  • 浏览
  • 评论

清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!

2024-03-04 12:02:51
清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!
近期,清华大学和哈尔滨工业大学联合发布了一篇论文:把大模型压缩到 1.0073 个比特时,仍然能使其保持约 83% 的性能!...

硅谷钢铁侠起诉奥特曼!GPT-4开源有希望了?

2024-03-04 12:02:31
硅谷钢铁侠起诉奥特曼!GPT-4开源有希望了?
与此同时,马斯克在旧金山高等法院提起的诉讼概述了几项不满,包括违反合同、违反信托义务和不公平的商业行为。此外,他要求 OpenAI 恢复其开源精神,并寻求禁令以防止利用 AGI 技术谋取利益。...

RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba

2024-03-04 12:02:25
RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba
去年 12 月,新架构 Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 发起了挑战。如今,谷歌 DeepMind「Hawk 」和「Griffin 」的推出为 AI 圈提供了新的选择。...

马斯克用微软论文当论据起诉OpenAI:你们自己早承认AGI了

2024-03-04 12:02:18
马斯克用微软论文当论据起诉OpenAI:你们自己早承认AGI了
一年前微软研究院发表的论文《Sparks of AGI:Early experiments with GPT-4》,现在成为了马斯克起诉书中的关键角色。...

北大具身智能成果入选CVPR'24:只需一张图一个指令,就能让大模型玩转机械臂

2024-03-04 12:02:11
北大具身智能成果入选CVPR'24:只需一张图一个指令,就能让大模型玩转机械臂
大多的具身操纵工作主要依赖大语言模型的推理能力来进行任务编排和规划。然而,鲜有研究探索大语言模型在实现低层原子任务(low-level action)方面的潜力。...

倪光南院士探讨RAG技术、AI代理及AI伦理挑战

2024-03-04 12:02:04
倪光南院士探讨RAG技术、AI代理及AI伦理挑战
由人工智能引领的新一轮科技革命和产业变革正在全球范围内蓬勃兴起。当前世界各国都在作出重大部署,将人工智能领域作为提升国家竞争的科创高地。...

北大发起复现Sora,框架已搭!袁粒田永鸿领衔,AnimateDiff大神响应

2024-03-04 12:01:58
北大发起复现Sora,框架已搭!袁粒田永鸿领衔,AnimateDiff大神响应
对于Sora视频的可变长宽比,团队通过参考上海AI Lab刚刚提出的FiT(Flexible Vision Transformer for Diffusion Model,即“升级版DiT”)实施一种动态掩码策略,从而在并行批量训练的同时保持灵活的长宽比。...

只需少量计算和内存资源即可运行的小型 Llama 大模型

2024-03-04 12:01:51
只需少量计算和内存资源即可运行的小型 Llama 大模型
TinyLlama 是一个令人兴奋的开源项目,它正在积极解决一些关键问题,并在开源社区中得到了广泛的关注。...

逆天UniVision:BEV检测和Occ联合统一框架,双SOTA!

2024-03-04 12:01:44
逆天UniVision:BEV检测和Occ联合统一框架,双SOTA!
UniVision是一个简单高效的框架,它统一了以视觉为中心的3D感知中的两个主要任务,即占用预测和目标检测。...

Llama3将于7月发布!当下处于微调中!

2024-03-04 12:01:37
Llama3将于7月发布!当下处于微调中!
Llama在Meta的AI战略中占据重要位置,旨在提升广告工具并增强社交媒体应用的吸引力。在最近的投资者讨论中,Meta首席执行官马克·扎克伯格强调了今年的关键优先事项,其中包括Llama 3的发布以及持续努力改进Meta AI助手。​...