首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:百度世界2024大会发布文心iRAG和无代码“秒哒”;阿里开源Qwen2.5-Coder全系列;谷歌开源诺奖化学模型AlphaFold3

2024-11-12 15:41 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、百度世界2024大会重磅发布文心 iRAG 和无代码工具 “秒哒”

在百度世界2024大会上,百度创始人李彦宏发布了文心 iRAG 技术和无代码工具 “秒哒”,引领AI应用新潮流。这两项技术的推出将极大地提升AI生成内容的实用性和开发效率,为创意产业带来革命性变革。李彦宏展示了技术应用的强大效果,预示着AI应用将进入崭新时代。

image.png

【AiBase提要:】

🌟 文心 iRAG 技术解决了大模型生成图像的幻觉问题,提升了实用性。

💻 无代码工具 “秒哒” 允许用户通过自然语言实现复杂的应用开发,降低了技术门槛。

🤖 智能体将成为未来AI应用的主要形式,推动企业营销和服务的效率提升。

2、通义千问开源Qwen2.5-Coder全系列 代码能力追平 GPT-4o

通义千问团队最新开源Qwen2.5-Coder全系列,旨在推动Open Code LLMs的发展。该系列模型以强大、多样和实用性著称,其中Qwen2.5-Coder-32B-Instruct模型在代码能力上达到SOTA水平,与GPT-4o相当。开源的四个尺寸模型覆盖主流六个模型尺寸,满足不同开发者需求。

image.png

【AiBase提要:】

🚀 Qwen2.5-Coder-32B-Instruct模型在代码能力达到SOTA水平,展现全面的能力,包括代码生成、修复和推理。

💡 Qwen2.5-Coder在多个代码生成基准测试中表现最佳,在Aider基准测试中达到73.7分,支持超过40种编程语言。

🔧 Qwen2.5-Coder-32B-Instruct在多编程语言的代码修复能力上表现出色,在MdEval基准测试中得分75.2,排名第一

详情链接:https://modelscope.cn/collections/Qwen25-Coder-9d375446e8f5814a

3、秘塔AI搜索上线专题功能 支持收藏、定制数据源

秘塔AI搜索推出全新的专题功能,允许用户上传资料至知识库,定制个人或专业领域的数据源,提升搜索效率和相关性。用户可创建专属搜索环境,增强搜索体验。API功能允许集成专题搜索能力到用户程序中,提供个性化和专业化搜索服务。

image.png

【AiBase提要:】

🔍 用户可上传资料至知识库,定制个人或专业领域的数据源,提升搜索效率和相关性。

📚 用户可通过三种方式上传知识:AI搜索到的网页或文件、收藏满意的搜索结果,直接上传电脑中的资料。

🔗 秘塔AI搜索提供API功能,允许用户将专题搜索能力集成到自己的程序中,满足不同用户在学术研究和专业领域的需求。

4、谷歌DeepMind开源AlphaFold3:诺奖化学模型,助力药物研发!

谷歌DeepMind意外发布了AlphaFold3的源代码和模型权重,标志着科学发现和药物开发的重大进展。创造者获得2024年诺贝尔化学奖,表彰在蛋白质结构预测方面的贡献。AlphaFold3技术能力有质的飞跃,可建模蛋白质、DNA、RNA及小分子复杂相互作用,对药物发现和疾病治疗至关重要。

image.png

【AiBase提要:】

🌟 AlphaFold3的发布将加速科学发现和药物开发。

🔬 新版本能建模复杂的分子相互作用,包括蛋白质、DNA、RNA和小分子。

📈 开源方式旨在平衡科学研究和商业利益,促进学术探索。

详情链接:https://github.com/google-deepmind/alphafold3

5、百度发布首款中文大模型AI眼镜:45克轻量设计,续航达56小时

百度在2024世界大会上首次亮相其最新AI硬件产品——小度AI眼镜,展现了百度在可穿戴设备领域的创新实力。这款产品轻量化设计,整机重量仅45克,配备16MP超广角摄像头,续航时间可达56小时。功能丰富,支持边走边问、卡路里识别、识物百科、视听翻译等实用功能。

image.png

【AiBase提要:】

🔍 小度AI眼镜是全球首款搭载中文大模型的原生AI眼镜,展示了百度在AI硬件领域的创新实力。

📸 小度AI眼镜采用轻量化设计,整机重量仅45克,配备16MP超广角摄像头,续航时间长达56小时。

🔊 声学系统采用四麦克风阵列设计,功能丰富,支持边走边问、卡路里识别、识物百科、视听翻译等实用功能。

6、无需顶级显卡,Meissonic 让你轻松生成媲美 SDXL 的高清大图!

Meissonic 是一款颠覆性的图像生成模型,通过一系列架构创新和优化策略,将非自回归掩码图像建模技术提升到与顶级扩散模型相媲美的水平。其性能和效率得到显著提高,仅有10亿参数就能生成高质量的1024×1024分辨率图像,且在消费级 GPU 上运行流畅。Meissonic在训练过程中分阶段优化,通过定量和定性指标评估,展现出优越的性能和效率。同时,在零样本图像到图像编辑方面也表现出色。

image.png

【AiBase提要:】

⚙️ 架构创新和优化策略提升非自回归掩码图像建模技术水平

💡10亿参数生成1024×1024高质量图像,性能优越

🔗 Meissonic在训练过程中分阶段优化,表现出色

详情链接:https://github.com/viiika/Meissonic

7、AI换头技术CHANGER:参考头像照片与目标身体无缝集成

CHANGER 是一种新型头部融合管道,旨在解决数字内容创作中的头部合成问题。该技术通过色键技术和 H2增强,实现高保真背景和头部融合效果。研究表明,CHANGER 的表现超过了现有的主流合成技术,适用于多种工业应用。

【AiBase提要:】

🌟 CHANGER 提供高保真的头部合成解决方案,解决了头部形状和发型结构差异导致的合成边界不自然问题。

🔧 CHANGER 采用色键技术和 H2增强技术,实现无伪影的背景生成和模拟各种头部形状和发型。

📈 CHANGER 在定量和定性评估结果中超越现有技术,展现出工业级的高保真合成效果。

详情链接:https://hahminlew.github.io/changer/

8、想让机器人更智能?清华团队发现机器人学习速成秘诀

这篇文章讨论了清华大学研究团队最近发表的论文,探讨了机器人模仿学习中的数据规模化规律,提出了高效的数据收集策略,使得机器人能够在新环境和新物体上实现约90%的成功率。研究结果表明数据规模化规律对机器人学习至关重要,为实现通用机器人解决复杂问题提供了新思路。

image.png

【AiBase提要:】

🔍 机器人学习速成秘诀:清华团队提出高效数据收集策略,实现90%成功率。

📊 数据规模化规律:幂律关系影响机器人泛化能力。

💡 高效数据收集策略:在多样环境中收集数据,每个环境一个物体,训练强泛化能力策略。

详情链接:https://arxiv.org/pdf/2410.18647

9、AI 品牌命名神器Namify AI

作为一款AI品牌命名工具,Namify AI为企业提供了简化品牌命名过程的解决方案。通过智能生成品牌名称、自动商标和域名检查以及免费徽标生成支持,帮助企业快速找到合适的品牌名称并确保其合法性和可用性。Namify AI的出现为企业提供了创新的品牌命名方法,提升了效率,同时助力品牌推广和形象塑造。

image.png

【AiBase提要:】

🌟 AI 工具简化品牌命名: Namify AI通过智能生成品牌名称,帮助企业快速找到合适的选项。

🔍 自动商标和域名检查: 工具能自动检查商标及域名的可用性,确保品牌名称的合法性。

🎨 免费徽标生成支持: Namify AI提供免费徽标选项,助力企业的品牌推广和形象塑造。

详情链接:https://namify.tech/

10、马斯克有望入驻白宫?请愿书呼吁特朗普任命其为AI顾问!

马斯克作为人工智能领域的重要人物,受到了一个名为“负责任创新美国”的团体的请愿,呼吁特朗普任命他为白宫人工智能特别顾问。这一举动引发了关于人工智能安全性、监管和责任的讨论。

【AiBase提要:】

🌟 马斯克被提名为白宫人工智能特别顾问,强调其在安全和技术发展方面的贡献。

📈 马斯克在特斯拉和新创公司 xAI 的参与凸显其在人工智能革命中的重要角色。

⚖️ 马斯克支持的加州法案被否决,引发对大型科技公司的监管和责任问题的讨论。

11.百度文心大模型日调用量突破15亿,半年增长超7.5倍

在2024百度世界大会上,百度创始人李彦宏宣布,文心大模型的日均调用量已超过15亿次,过去半年增长超过7.5倍。这一成绩标志着百度在人工智能领域的快速发展和技术应用的广泛前景,李彦宏曾预测若能在一年内达到20亿次,将进一步巩固百度的行业地位。

image.png

【AiBase提要:】

🚀 文心大模型的日均调用量已突破15亿次,显示出强劲的市场需求。

📈 在过去半年内,文心大模型的调用量增长超过7.5倍。

🧠 李彦宏预测若日调用量达到20亿次,将进一步巩固百度在人工智能领域的竞争优势。

举报

  • 相关推荐
  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • AI日报:昆仑万维天工超级智能体发布;OpenAI核心API支持MCP;百度飞桨PaddleOCR 3.0开源

    【AI日报】汇总了近期AI领域重要动态:1)百度飞桨发布PaddleOCR3.0,提升文字识别精度13%;2)昆仑万维发布天工超级智能体,AI办公成本仅为OpenAI的40%;3)OpenAI API新增MCP支持简化开发流程;4)xAI推出实时网页搜索API;5)谷歌Sparkify可将问题秒变动画;6)Mistral发布高效代码模型Devstral;7)Video Ocean推出4K视频生成工具;8)谷歌推出AI内容识别工具SynthID;9)谷歌NotebookLM使用量半年增长56%;10)硅基流动升级128K长文本模型;11)DeepMind发布音乐生成模型Lyria2;12)多模态大模型MMaDA实现跨模态推理;13)微软发布网页智能体Magentic-UI;14)Framer推出AI建站套件。

  • 开源共建智启未来 开源鸿蒙开发者大会2025成功举办

    5月24日,开源鸿蒙开发者大会2025在深圳隆重开幕。大会发布了开源鸿蒙5.1版本,并启动了应用技术组件共建和AI+Agent技术共建等重要项目。会议设立八大主题论坛,邀请行业专家和开发者共同探讨技术发展。深圳市政府表示将持续支持开源鸿蒙生态建设。开放原子开源基金会理事长程晓明指出,开源鸿蒙已成为发展最快的开源操作系统之一,代码规模达1.3亿行,覆盖金融、交通等多个领域。大会还展示了基于开源鸿蒙的创新产品,包括智能手表、笔记本等设备,并举办了第二届中国研究生操作系统开源创新大赛启动仪式。未来开源鸿蒙将持续推进全球化生态布局,构建万物互联新生态。

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • 开源鸿蒙开发者大会2025成功召开,启动开源鸿蒙应用技术组件共建

    截至目前,开源鸿蒙已累计发布 8 个大版本,共建共享 15 个技术域的 1115 款开源三方库和 6 个跨平台框架,加速应用和设备的开发。

  • KANZI开源鸿蒙版闪耀亮相开源鸿蒙开发者大会2025

    5月24日,开源鸿蒙开发者大会2025在深圳隆重开幕。大会发布了开源鸿蒙5.1版本,并启动了开源鸿蒙应用技术组件共建、AI Agent技术共建等重要项目。OSWare奥思维携Kanzi开源鸿蒙版亮相,展示了基于OpenHarmony系统的3D HMI解决方案,其核心优势包括:1)高效开发与逼真渲染效果,支持60FPS流畅运行;2)一次开发多端部署,兼容分布式能力;3)通过工程模板和所见即所得设计模式,可缩短50%以上开发周期。Kanzi作为汽车行业HMI开发工具链,已成功适配开源鸿蒙系统,填补了高端HMI开发工具空白,助力车企应对技术挑战。未来OSWare将持续推动Kanzi与开源鸿蒙生态对接,加速商业化落地,计划与头部车企合作打造智能座舱标杆案例。

  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。

  • AI日报:美团No Code平台免费开放;豆包App升级“一句话P图”功能;苹果Xcode 26内置ChatGPT等AI功能

    本文介绍了AI领域多项重要进展:1)美团推出No Code平台和1680个AI应用;2)豆包App升级"一句话P图"功能;3)苹果发布内置ChatGPT的Xcode26开发工具;4)iOS26新增视觉智能功能;5)讯飞星火X1升级版即将发布;6)比亚迪接入阿里通义大模型;7)DeepSeek支持本地工具调用;8)开源框架Rowboat支持快速构建智能助手;9)X平台整合Grok AI优化内容推荐;10)港科大开发进化搜索技术提升小模型图像生成能力;11)硅基流动完成数亿元融资;12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。