首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:百度世界2024大会发布文心iRAG和无代码“秒哒”;阿里开源Qwen2.5-Coder全系列;谷歌开源诺奖化学模型AlphaFold3

2024-11-12 15:41 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、百度世界2024大会重磅发布文心 iRAG 和无代码工具 “秒哒”

在百度世界2024大会上,百度创始人李彦宏发布了文心 iRAG 技术和无代码工具 “秒哒”,引领AI应用新潮流。这两项技术的推出将极大地提升AI生成内容的实用性和开发效率,为创意产业带来革命性变革。李彦宏展示了技术应用的强大效果,预示着AI应用将进入崭新时代。

image.png

【AiBase提要:】

🌟 文心 iRAG 技术解决了大模型生成图像的幻觉问题,提升了实用性。

💻 无代码工具 “秒哒” 允许用户通过自然语言实现复杂的应用开发,降低了技术门槛。

🤖 智能体将成为未来AI应用的主要形式,推动企业营销和服务的效率提升。

2、通义千问开源Qwen2.5-Coder全系列 代码能力追平 GPT-4o

通义千问团队最新开源Qwen2.5-Coder全系列,旨在推动Open Code LLMs的发展。该系列模型以强大、多样和实用性著称,其中Qwen2.5-Coder-32B-Instruct模型在代码能力上达到SOTA水平,与GPT-4o相当。开源的四个尺寸模型覆盖主流六个模型尺寸,满足不同开发者需求。

image.png

【AiBase提要:】

🚀 Qwen2.5-Coder-32B-Instruct模型在代码能力达到SOTA水平,展现全面的能力,包括代码生成、修复和推理。

💡 Qwen2.5-Coder在多个代码生成基准测试中表现最佳,在Aider基准测试中达到73.7分,支持超过40种编程语言。

🔧 Qwen2.5-Coder-32B-Instruct在多编程语言的代码修复能力上表现出色,在MdEval基准测试中得分75.2,排名第一

详情链接:https://modelscope.cn/collections/Qwen25-Coder-9d375446e8f5814a

3、秘塔AI搜索上线专题功能 支持收藏、定制数据源

秘塔AI搜索推出全新的专题功能,允许用户上传资料至知识库,定制个人或专业领域的数据源,提升搜索效率和相关性。用户可创建专属搜索环境,增强搜索体验。API功能允许集成专题搜索能力到用户程序中,提供个性化和专业化搜索服务。

image.png

【AiBase提要:】

🔍 用户可上传资料至知识库,定制个人或专业领域的数据源,提升搜索效率和相关性。

📚 用户可通过三种方式上传知识:AI搜索到的网页或文件、收藏满意的搜索结果,直接上传电脑中的资料。

🔗 秘塔AI搜索提供API功能,允许用户将专题搜索能力集成到自己的程序中,满足不同用户在学术研究和专业领域的需求。

4、谷歌DeepMind开源AlphaFold3:诺奖化学模型,助力药物研发!

谷歌DeepMind意外发布了AlphaFold3的源代码和模型权重,标志着科学发现和药物开发的重大进展。创造者获得2024年诺贝尔化学奖,表彰在蛋白质结构预测方面的贡献。AlphaFold3技术能力有质的飞跃,可建模蛋白质、DNA、RNA及小分子复杂相互作用,对药物发现和疾病治疗至关重要。

image.png

【AiBase提要:】

🌟 AlphaFold3的发布将加速科学发现和药物开发。

🔬 新版本能建模复杂的分子相互作用,包括蛋白质、DNA、RNA和小分子。

📈 开源方式旨在平衡科学研究和商业利益,促进学术探索。

详情链接:https://github.com/google-deepmind/alphafold3

5、百度发布首款中文大模型AI眼镜:45克轻量设计,续航达56小时

百度在2024世界大会上首次亮相其最新AI硬件产品——小度AI眼镜,展现了百度在可穿戴设备领域的创新实力。这款产品轻量化设计,整机重量仅45克,配备16MP超广角摄像头,续航时间可达56小时。功能丰富,支持边走边问、卡路里识别、识物百科、视听翻译等实用功能。

image.png

【AiBase提要:】

🔍 小度AI眼镜是全球首款搭载中文大模型的原生AI眼镜,展示了百度在AI硬件领域的创新实力。

📸 小度AI眼镜采用轻量化设计,整机重量仅45克,配备16MP超广角摄像头,续航时间长达56小时。

🔊 声学系统采用四麦克风阵列设计,功能丰富,支持边走边问、卡路里识别、识物百科、视听翻译等实用功能。

6、无需顶级显卡,Meissonic 让你轻松生成媲美 SDXL 的高清大图!

Meissonic 是一款颠覆性的图像生成模型,通过一系列架构创新和优化策略,将非自回归掩码图像建模技术提升到与顶级扩散模型相媲美的水平。其性能和效率得到显著提高,仅有10亿参数就能生成高质量的1024×1024分辨率图像,且在消费级 GPU 上运行流畅。Meissonic在训练过程中分阶段优化,通过定量和定性指标评估,展现出优越的性能和效率。同时,在零样本图像到图像编辑方面也表现出色。

image.png

【AiBase提要:】

⚙️ 架构创新和优化策略提升非自回归掩码图像建模技术水平

💡10亿参数生成1024×1024高质量图像,性能优越

🔗 Meissonic在训练过程中分阶段优化,表现出色

详情链接:https://github.com/viiika/Meissonic

7、AI换头技术CHANGER:参考头像照片与目标身体无缝集成

CHANGER 是一种新型头部融合管道,旨在解决数字内容创作中的头部合成问题。该技术通过色键技术和 H2增强,实现高保真背景和头部融合效果。研究表明,CHANGER 的表现超过了现有的主流合成技术,适用于多种工业应用。

【AiBase提要:】

🌟 CHANGER 提供高保真的头部合成解决方案,解决了头部形状和发型结构差异导致的合成边界不自然问题。

🔧 CHANGER 采用色键技术和 H2增强技术,实现无伪影的背景生成和模拟各种头部形状和发型。

📈 CHANGER 在定量和定性评估结果中超越现有技术,展现出工业级的高保真合成效果。

详情链接:https://hahminlew.github.io/changer/

8、想让机器人更智能?清华团队发现机器人学习速成秘诀

这篇文章讨论了清华大学研究团队最近发表的论文,探讨了机器人模仿学习中的数据规模化规律,提出了高效的数据收集策略,使得机器人能够在新环境和新物体上实现约90%的成功率。研究结果表明数据规模化规律对机器人学习至关重要,为实现通用机器人解决复杂问题提供了新思路。

image.png

【AiBase提要:】

🔍 机器人学习速成秘诀:清华团队提出高效数据收集策略,实现90%成功率。

📊 数据规模化规律:幂律关系影响机器人泛化能力。

💡 高效数据收集策略:在多样环境中收集数据,每个环境一个物体,训练强泛化能力策略。

详情链接:https://arxiv.org/pdf/2410.18647

9、AI 品牌命名神器Namify AI

作为一款AI品牌命名工具,Namify AI为企业提供了简化品牌命名过程的解决方案。通过智能生成品牌名称、自动商标和域名检查以及免费徽标生成支持,帮助企业快速找到合适的品牌名称并确保其合法性和可用性。Namify AI的出现为企业提供了创新的品牌命名方法,提升了效率,同时助力品牌推广和形象塑造。

image.png

【AiBase提要:】

🌟 AI 工具简化品牌命名: Namify AI通过智能生成品牌名称,帮助企业快速找到合适的选项。

🔍 自动商标和域名检查: 工具能自动检查商标及域名的可用性,确保品牌名称的合法性。

🎨 免费徽标生成支持: Namify AI提供免费徽标选项,助力企业的品牌推广和形象塑造。

详情链接:https://namify.tech/

10、马斯克有望入驻白宫?请愿书呼吁特朗普任命其为AI顾问!

马斯克作为人工智能领域的重要人物,受到了一个名为“负责任创新美国”的团体的请愿,呼吁特朗普任命他为白宫人工智能特别顾问。这一举动引发了关于人工智能安全性、监管和责任的讨论。

【AiBase提要:】

🌟 马斯克被提名为白宫人工智能特别顾问,强调其在安全和技术发展方面的贡献。

📈 马斯克在特斯拉和新创公司 xAI 的参与凸显其在人工智能革命中的重要角色。

⚖️ 马斯克支持的加州法案被否决,引发对大型科技公司的监管和责任问题的讨论。

11.百度文心大模型日调用量突破15亿,半年增长超7.5倍

在2024百度世界大会上,百度创始人李彦宏宣布,文心大模型的日均调用量已超过15亿次,过去半年增长超过7.5倍。这一成绩标志着百度在人工智能领域的快速发展和技术应用的广泛前景,李彦宏曾预测若能在一年内达到20亿次,将进一步巩固百度的行业地位。

image.png

【AiBase提要:】

🚀 文心大模型的日均调用量已突破15亿次,显示出强劲的市场需求。

📈 在过去半年内,文心大模型的调用量增长超过7.5倍。

🧠 李彦宏预测若日调用量达到20亿次,将进一步巩固百度在人工智能领域的竞争优势。

举报

  • 相关推荐
  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • 中国无纸化2024年度TOP10企业重磅发布!itc保伦股份荣获全国第一!

    ITC保伦股份凭借技术实力和广泛市场覆盖,在2024年中国无纸化企业市场排名中位居榜首。其无纸化会议系统实现全流程管理,满足文档发送、阅读、共享、交流等需求,并整合会议生态,提供扩声、语音转写、视频会议等功能。公司拥有80亩工业园和16000平方米全自动生产车间,产品覆盖党政机关、法院、医院等多个领域。ITC坚持国产化研发,采用SM2、SM3、SM4国密算法保障信息安全,已成功应用于杭州亚运会等多个重要项目。随着数字化浪潮推进,无纸化作为数字化基石的重要性日益凸显,ITC将继续引领技术创新,推动行业迈向更智能、安全、普惠的未来。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • AI日报:百度发布“绘想”平台与MuseSteamer;阿里音频驱动全身数字人模型OmniAvatar

    【AI日报】今日AI领域重要动态:1.开源语音大模型Step-Audio-AQAA发布,实现音频到语音的端到端自然转换;2.百度推出"绘想"平台与MuseSteamer,通过AI一键生成专业级视频;3.浙大与阿里联合发布OmniAvatar,音频驱动数字人技术取得突破;4.百度搜索迎十年来最大改版,新增智能框、百看和AI助手功能;5.xAI开发者控制台新增Grok4及Grok4Code引用,预示新一代AI模型即将发布;6.Gemin

  • @开发者们:百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!

    6月30日,百度文心大模型4.5系列正式开源并在国内领先的开源平台GitCode首发上线。该系列包含10款模型,涵盖47B和3B参数的混合专家(MoE)模型及0.3B的稠密参数模型,采用创新的多模态异架构结构实现跨模态知识融合。模型基于飞桨框架开发,训练效率达47% MFU,在文本和多模态基准测试中达到SOTA水平。所有模型按Apache2.0协议开源,配套产业级开发套件支持多种芯片部署。GitCode平台已汇聚620万用户,为AI开发者提供代码托管、协同开发等全流程支持。此次开源将推动中国AI生态创新,加速大模型技术产业化应用。

  • 双第一!百度智能云领跑2025上半年大模型中标市场

    2025年上半年,全球AI产业迎来关键拐点,多模态理解、深度逻辑推理等核心能力实现重大突破。大模型加速渗透产业核心场景,推动AI从通用能力向深度行业应用转变。我国大模型项目呈现爆发式增长,中标项目累计1810个,金额突破64亿元。百度智能云表现突出,以48个中标项目和5.1亿元金额稳居"双第一",在金融、能源、政务等重点行业持续领先。行业趋势表明,大模型市场正从"通用竞争"迈向"行业深耕"阶段,技术实力与落地能力成为关键。百度智能云依托领先的大模型技术与全栈智能基础设施,助力企业高效部署应用AI,目前已有65%央企选择与其合作。在能源、交通、金融等领域,百度打造了多个行业标杆案例,显著提升业务效率。

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�