首页 > 业界 > 关键词  > MM1最新资讯  > 正文

今日AI:苹果大模型MM1入场;Sora训练数据来源竟来自这;全球最快AI芯片WSE-3发布;阿里邀请AI参加数学竞赛

2024-03-15 15:37 · 稿源:站长之家

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240315154743.png

📰🤖📢AI新鲜事

苹果大模型MM1入场:参数达到300亿 超半数作者是华人

【AiBase提要:】

🍎 苹果发布大型多模态基础模型MM1,拥有300亿参数,MoE架构,超半数作者是华人。

👥 MM1在多模态领域表现出竞争力,标志着苹果在该领域的重要进展。

🔮 该模型为未来苹果可能推出的产品奠定了技术基础,对GenAI领域发展具有重要意义。

论文地址:https://arxiv.org/pdf/2403.09611.pdf

全球最快AI芯片WSE-3发布 性能碾压H100!

image.png

【AiBase提要:】

🌟 WSE-3采用4万亿晶体管5nm制程,拥有125FP16PetaFLOPS性能,比H100GPU强大。

🌟 单机可训练24万亿参数的模型,具备90万个AI核心和44GB片上SRAM存储。

🌟 Cerebras的CS-3超算可训练比GPT-4和Gemini大十倍的下一代前沿大模型。

Midjourney禁止用户生成拜登和特朗普图片

【AiBase提要:】

🚫 Midjourney开始禁止用户创造涉及拜登和特朗普的虚假图片,以维护选举公正性。

🤖 新政策旨在防止AI技术被用于制造虚假信息,体现了对保护选举公正性的承诺。

🛑 CEO表示公司将采取更严格的态度处理选举相关事务,遏制可能影响公正性的行为。

Claude3Haiku API发布

QQ截图20240315102558.png

【AiBase提要:】

⭐ Haiku是Anthropic发布的速度最快、最有性价比的型号

⭐ Haiku每秒可处理21,000个令牌,提供先进的视觉功能。

⭐ 只需1美元就可以处理和分析400起最高法院案件或2500张图片

产品入口:https://top.aibase.com/tool/claude-3-haiku

OpenAI CTO承认Sora训练数据来源,引发争议

【AiBase提要:】

⭐️ Sora接受公开和许可数据训练,数据来源不明确引发争议;

⭐️ Sora生成视频与现实接近,需改进和适应时间;

⭐️ OpenAI计划增加音频生成功能,改进模型易用性。

阿里数赛首次向AI开放!知乎网友:给AI捏了把汗,该防止人类替考

image.png

【AiBase提要:】

⭐️ 阿里全球数学竞赛向硅基AI开放,最高奖金1万美金。

⭐️ AI参赛引发热烈讨论,挑战人类解题能力。

⭐️ AI模型表现不一,未来AI或成数学研究助手。

详情:https://www.chinaz.com/2024/0315/1603514.shtml

苹果完成收购加拿大公司 DarwinAI iOS18将有重大更新

【AiBase提要:】

🍏 苹果完成收购加拿大的DarwinAI公司,强化人工智能团队。

🍎 DarwinAI专注于开发人工智能技术,提高人工智能效率。

🍏 苹果将在iOS18和macOS15操作系统增加人工智能功能,保护用户隐私。

Meta公布Llama3训练集群细节!储备60万块H100迎接AGI

【AiBase提要:】

⭐️ Meta公开技术博客展示算力资源和AI Infra路线图

⭐️ 集群由24576个H100GPU组成,用于训练Llama3

⭐️ 存储部署采用Tectonic和Hammerspace满足数据需求

谷歌 I/O 开发者大会5月14日举行 聚焦Gemini模型与Android15

【AiBase提要:】

🌐 谷歌宣布5月14日举办2024年I/O开发者大会,通过网络直播形式进行。

📱 展示Gemini模型和Android15新功能,吸引广泛开发者关注。

💡 Gemini1.5Pro模型在处理长篇信息时表现出色,开辟新的AI发展可能性。

🤖📱💼AI应用

Devin“平替”来了!Babel Agent可自主编译代码

【AiBase提要:】

🤖 Babel Agent是类似Devin的AI软件构建Agents,能通过自主驱动的Agents解决编码、调试、测试、部署问题。

👨‍💻 Babel Agent具备自主编写和编译代码能力,能自主调试和解决问题,减少人工干预,提高开发效率。

🛠️ Babel Agent支持自主集成新发布的Claude3,具有自主修正问题和寻求人工帮助能力,提高软件稳定性。

官网:https://top.aibase.com/tool/babel-cloud

AI实时绘画系统StreamMultiDiffusion 支持局部涂抹+提示生成图片

image.png

【AiBase提要】

⭐ StreamMultiDiffusion是实时、交互式文本到图像生成系统

⭐ 根据绘制区域颜色精确控制生成内容

⭐ 红色区域生成人物,在耳朵和尾巴区域标记为狗,会根据涂抹区域生成带狗耳朵的人物

项目地址:https://top.aibase.com/tool/streammultidiffusion

Glyph-ByT5:确保AI绘画图片中文字渲染的准确性并自动排版

image.png

【AiBase提要:】

⭐ Glyph-ByT5提高图像生成中文本渲染准确性

⭐ Glyph-ByT5理解每个字母和符号确保准确显示

⭐ 可以使用GPT-4和Glyph-SDXL模型来自动化生成和优化排版布局

项目地址:https://top.aibase.com/tool/glyph-byt5

Muse Pro:一款专为iPad设计的AI实时画图应用

QQ截图20240315104047.png

【AiBase提要:】

🎨 随便涂几笔,AI都能转化为高质量图片

🎨 快速增强和放大功能,分辨率高到可以直接打印

🎨 提供丰富自定义画笔,支持图层操作,适合不同艺术风格和技巧。

应用下载地址:https://top.aibase.com/tool/muse-pro

文本转3D动画工具Cartwheel 可指定动作还可导出到任何3D程序中编辑

【AiBase提要:】

⭐ 只需输入文字提示即可生成3D动画角色。

⭐ 生成的角色是可以指定动作,还可以直接导出到任何3D程序中进行编辑

⭐ 尽管目前在测试阶段,但已能生成许多酷炫动作

排队地址:https://top.aibase.com/tool/cartwheel

图像新技术Follow-Your-Click:用户指哪动哪

【AiBase提要:】

🖱️ 用户点击或提示,就可以让图像特定区域动起来

👥 香港科技大学、腾讯、清华大学合作开发

🖼️ 用户简单点击和短语提示即可控制动画

https://top.aibase.com/tool/follow-your-click

AI图像平台Fotor推出一站式AI长视频平台Clipfly

【AiBase提要:】

🚀 Fotor正式进军视频领域,推出Clipfly平台

🎥 Clipfly集成AI视频生成、增强和编辑功能

💡 用户可完成从构思到最终视频输出的整个流程

体验地址:https://top.aibase.com/tool/clipfly

————————————

今日Midjourney提示词:春日主题古风美女

3_1710473531527_ai2023__AnimeThis_picture_shows_a_woman_wearing_traditional_Chi_54bde866-8b5a-45e5-be8b-f1602870b339_副本.png

图源备注:图片由AI生成,图片授权服务商Midjourney

垫图+Anime,This picture shows a woman wearing traditional Chinese clothing, which looks like ancient Chinese clothing, possibly Hanfu or Tangzhuang. She holds a bouquet of flowers, possibly for decoration or as a gift. Her hairstyle is also very distinctive, with her hair pulled up and fixed with a hairpin, which was a common hairstyle among ancient Chinese women.Her clothing and hairstyle suggest that this picture may be for filming a costume drama, movie, or showcasing traditional culture. Her expression is soft, her gaze looks into the distance, giving people a sense of tranquility and elegance.The background is blurry, but it can be seen that it is a natural environment with ripples, possibly lakes or rivers, which adds a soft background to the picture.Overall, this picture gives people a feeling of classicism, elegance, and tradition, which may be promoting traditional Chinese culture or showcasing the charm of ancient clothing. --ar3:4--niji6--s400

举报

  • 相关推荐
  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 世俱杯亚欧巅峰对决!海信100吋电视AI芯片呈现高光瞬间

    文章主要报道了世界杯1/8决赛曼城与利雅得新月的精彩对决,重点描述了贝纳尔多·席尔瓦的凌空抽射和哈兰德的关键头球等精彩瞬间。同时指出100英寸大屏电视已成为观赛主流选择,海信电视凭借RGB-Mini LED技术和330Hz高刷新率等优势,能带来更沉浸的观赛体验。数据显示世界杯期间100英寸以上大屏电视销量同比增长超109%,海信全球市场份额达56.71%,领跑行业。文章强调优质大屏电视能提升观赛参与感,建议球迷选择画质优秀、刷新率高、视角广的100英寸电视,以获得最佳观赛效果。

  • 阿里巴巴发布全球首个胃癌影像筛查AI模型:CT就能识别早期胃癌

    浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE。 该模型首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。 相关论文在24日登上了国际顶级期刊《自然医学》(Nature Medicine)。 据国家癌症中心统计,我国每年新发胃癌约36万例,死亡26万例,死亡人数在所有恶性肿瘤中位列第�

  • 玄武云出席崔牛会AI活动,聊聊AI大模型如何掌握终端信息

    6月20日,崔牛会主办的AI发现者计划之AI+OPEN DAY在广州举办,玄武云与百度云等企业围绕AI大模型应用展开探讨。玄武云分享了快消行业数字化转型解决方案,推出SKU超级模型和价签识别模型,帮助品牌商提升终端管理效率。其中SKU模型覆盖6000+商品,识别准确率达90%;价签模型准确率85%,已应用于知名薯片品牌。通过AI技术实现商品陈列优化、价格监控和渠道布局分析,助力快消企业从经验驱动转向数据智能驱动,在存量市场中创造增量价值。

  • Reddit 起诉 Anthropic,称其未支付AI训练数据费用

    OpenAI 首席执行官山姆·奥特曼(Sam Altman)持有 Reddit 8.7% 的股份,是该公司第三大股东,并曾是 Reddit 董事会成员……

  • 2025最新全球AI大模型排名,国内外模型动态洗牌(实时更新平台推荐)

    2025年全球AI大模型竞争进入白热化阶段,OpenAI、Google等国际巨头与中国企业激烈交锋。技术迭代远超预期,仅半年内排名就经历多次洗牌。当前全球AI大模型综合排名Top10显示:1)GPT-4.5综合80.4分领跑;2)Claude3.7编程领域领先;3)Gemini2.0多模态标杆;4)国产DeepSeek R1推理速度提升3倍;5)阿里Qwen2.5数学编程单项第一。中国模型通过开源策略、垂直优化和成本革命实现弯道超车,如DeepSeek R1仅耗资600万美元达到GPT-4水平,字节豆包采用稀疏MoE架构成本大幅降低。中文场景深度优化表现突出,如文心一言4.0方言交互准确率92%。开源生态爆发,通义千问全尺寸开源(7B~110B参数)在Hugging Face排名第一。权威评估需结合标准化测试、人类盲测和场景适配性。

  • 小鹏G7 Ultra算力全球第一!搭载三颗图灵AI芯片 2250Tops

    今晚小鹏G7正式发布,推出Ultra和Max两个版本: 小鹏G7 Max版:搭载2颗Orin-X芯片; 小鹏G7 Ultra版:搭载3颗图灵AI芯片,有效算力2250Tops,全球第一! 据介绍,小鹏G7全系标配图灵AI智能辅助驾驶,号称行业最强!

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • 6个AI大模型大战2025年高考数学新一卷:数学题推理能力均显著提升

    ​近日,随着高考的圆满结束,一场别开生面的“数学擂台赛”在各大AI大模型间悄然展开。多家知名科技公司的大模型被邀请参与2025年数学新课标Ⅰ卷中的14道客观题测试,以此检验它们在逻辑推理和数学能力上的实力。此次测试题目包含8道单选题、3道多选题以及3道填空题,满分设定为73分,且测试过程严格遵循高考判分原则,确保结果的公正性与准确性。 测试成绩揭晓�

  • 华为云发布盘古大模型5.5,宣布新一代昇腾AI云服务上线,成就行业AI先锋

    华为开发者大会2025(HDC2025)在东莞篮球中心开幕,发布多项AI创新成果:1)推出基于CloudMatrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量提升4倍;2)发布盘古大模型5.5,NLP、CV等五大基础模型全面升级,其中718B深度思考模型采用256专家MoE架构;3)推出行业首个统一预测架构Triplet Transformer,覆盖钢铁、水泥等多个工业场景;4)发布300亿参数视觉大模型,支持多维感知分析;5)升级盘古助手Doer,新增6大开发领域专业Agent。华为云宣布开发者突破800万,将构建昇腾、鸿蒙、鲲鹏等技术生态。