首页 > 原创 > 关键词  > AI搜索引擎最新资讯  > 正文

AI日报:阿里海外推AI搜索引擎Accio;Vidu-1.5版本即将上线;百度“自由画布”公测;OpenAI技术大佬Greg回归

2024-11-13 15:31 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里海外推出全球首个B2B领域AI搜索引擎Accio

阿里巴巴集团推出全球首个B2B领域AI搜索引擎Accio,旨在帮助商家更快速、更准确地找到所需的商品和供应商。Accio已在阿里国际站取得成功试运行,转化率提升20%-30%,商品量覆盖亿级。

QQ20241113-140726.png

【AiBase提要:】

🔍 Accio是全球第一个B2B领域的AI搜索引擎,帮助商家快速找到商品和供应商。

💼 Accio已在阿里国际站试运行,转化率提升20%-30%。

🌍 Accio覆盖的商品量已扩展到亿级,PC和WAP端产品已上线,覆盖 5 种语言。

详情链接:https://www.accio.ai/

2、百度AI创作产品“自由画布”已正式面向公众开启测试预约

百度在 2024 年 11 月 12 日举行的百度世界大会上宣布推出了“自由画布”,这是一项由百度文库和百度网盘联合推出的新功能,旨在激发人们的创造力和灵感。用户可以在其中自由创作、编辑、存储、管理、查找、观看、使用和分享内容,实现全流程的内容生产到消费。

image.png

【AiBase提要:】

⚙️ “自由画布”是由文心多模态大模型支持的万能白板,让每个人都能成为故事的主角、漫画家或短视频导演。

🔄 “自由画布”通过大模型技术实现了多格式、全模态文件的混合理解、生成和创作,打通了公域与私域内容,为用户提供一站式服务。

🔗 “自由画布”实现了输入、编辑、创作和分享的自由,用户可以在一个空间里生成包含多格式、全模态的内容,并方便地分享和存储。

详情链接:https://tanbi.baidu.com/h5apptopic/browse/freecanvasreservation

3、Anthropic即将推出 Claude3.5Opus,AI 竞争再升级

Anthropic的首席执行官宣布公司即将推出新一代人工智能模型Claude3.5Opus,引发行业期待。新模型将超越现有型号,重新分配能力曲线。AI竞争激烈,OpenAI和谷歌也将发布新模型。【AiBase提要:】

🚀 Anthropic计划推出Claude3.5Opus,引发行业期待。

🔍 新模型将超越现有型号,重新分配能力曲线。

⚔️ AI竞争加剧,OpenAI和谷歌也将发布新模型。

4、生数科技视频生成模型Vidu1. 5 版发布 攻克“多主体一致性”难题

生数科技自豪地宣布Vidu1. 5 新版本的问世,实现了世界领先水平的突破,加速了通用人工智能(AGI)的到来。Vidu1. 5 展现了视觉模型全新的“智能涌现”,生成效率领先,具备多元输入实现一致性生成,加速了AGI的到来。

image.png

【AiBase提要:】

🚀 Vidu1. 5 实现世界领先水平突破,加速通用人工智能到来。

🔑 Vidu1. 5 突破“一致性”难题,展现智能涌现,记忆管理能力。

💡 Vidu1. 5 提升视频模型可控性,实现多元输入一致性生成,加速AGI到来。

🔑体验地址:www.vidu.studio

5、小米计划推出新一代AI眼镜

小米计划在 2025 年第二季度发布新款AI眼镜,与歌尔公司合作,预计出货量超过三十万台。业内人士表示, 2025 年可能成为AI眼镜的爆发元年。百度也推出了小度AI眼镜,加剧了AI眼镜市场竞争。

【AiBase提要:】

🥽 小米计划于 2025 年Q2 发布新款AI眼镜,已与歌尔达成合作。

🚀 百度也推出了小度AI眼镜,其他科技巨头也在积极布局这一市场。

🔍 AI眼镜市场竞争加剧, 2025 年可能成为爆发元年。

6、技术大佬归来!Greg重返OpenAI,成重振公司关键?

Greg Brockman结束假期,重返OpenAI,为公司技术创新注入新动力。在高管离职潮背景下,Greg的回归被视为重振公司的关键时刻。他曾参与多个AI项目的开发,期待他为OpenAI带来新的技术突破。

image.png

【AiBase提要:】

🌟 Greg Brockman重返OpenAI,成为公司技术创新的新动力。

🚀 OpenAI近期高管离职频繁,Greg的回归被视为重振公司的关键。

🤖 Greg曾参与多个AI项目的开发,期待他为OpenAI带来新的技术突破。

7、百度文心智能体平台已吸引 80 万名开发者入驻

百度文心智能体平台在 2024 年的大会上推出五大商业组件功能,助力智能体的商业化进程。平台吸引了大量开发者入驻,收入转化数量和总分发量均大幅增长。开发者可通过新人扶持和优质加权等分发机制获取更多流量,同时推出多智能体聚合与推荐新产品形态。

image.png

【AiBase提要:】

🚀 文心智能体平台推出五大商业组件功能,支持智能体的商业化进程。

💼 开发者收入转化数量增长395%,单个智能体单次转化最高收入达到 10 万元。

📈 平台总分发量上涨 16 倍,有分发的智能体数量增长 22 倍。

8、剁手党狂喜!AI试衣技术Fashion-VDM颠覆传统 网购衣服再也不怕踩雷了!

Fashion-VDM技术为网购者带来革命性的试衣体验,通过视频扩散模型实现动态试穿衣服,效果逼真。技术采用先进的分离式无分类器引导技术和渐进式时间训练策略,结合图像和视频数据进行联合训练,打破传统虚拟试衣软件的局限性。虽然存在一些细节和体型方面的限制,但随着技术发展,Fashion-VDM将进一步完善,改变网购体验。

【AiBase提要:】

👗 Fashion-VDM技术实现动态试穿衣服,效果逼真,超越传统虚拟试衣软件。

🔬 采用分离式无分类器引导技术和渐进式时间训练策略,结合图像和视频数据进行联合训练。

💡 Fashion-VDM在图像质量、视频流畅度和服装还原度方面取得压倒性胜利,颠覆网购体验。

详情链接:https://johannakarras.github.io/Fashion-VDM/

9、对标谷歌NotebookLM!语音生成模型PlayDialog:可生成对话播客、旁白

Play AI推出的PlayDialog beta版本是一款能生成对话式的播客音频的端到端AI语音模型,能够调控语调、情感和语速,实现更自然的语音合成。该模型经过数亿次真实对话的训练,表现优异,能够理解整段对话的上下文,影响语音生成效果,让互动更加自然和人性化。同时,Play AI还推出了PlayNote工具,可以将多种媒体文件转化为对话体验,支持API接口。

image.png

【AiBase提要:】

🌟 PlayDialog beta是新一代语音模型,模拟人类对话更自然。

🎤 PlayNote工具能快速将各种媒体文件转化为有声内容,支持API接口。

🚀 PlayDialog beta在盲测中表现出色,语音生成流畅性和情感表达获得高分。

详情链接:https://play.ai/playnote

10、微软推出人格模拟AI工具TinyTroupe 基于LLM生成逼真模拟行为

微软最近发布了TinyTroupe,一款基于大型语言模型(LLM)的人格模拟AI工具。它支持商业决策与市场研究,可广泛应用于广告评估、软件测试、数据训练和产品反馈等领域。微软欢迎社区反馈,以不断优化产品,推动企业创新。

image.png

【AiBase提要:】

🔹 TinyTroupe是基于LLM的人格模拟AI工具,支持商业决策与市场研究。

🔹 可应用于广告评估、软件测试、数据训练和产品反馈等多个领域。

🔹 微软欢迎社区反馈,以优化产品,推动企业创新。

详情链接:https://github.com/microsoft/TinyTroupe?continueFlag=851dbfac5e76da467e3106b5f1e45573

11、苹果即将推出壁挂式 AI 平板设备

苹果公司即将推出一款全新的壁挂式平板设备,旨在成为家庭智能控制中心,集成了 Siri 和视频通话功能。该产品将在明年 3 月推出,是苹果在智能家居领域的重要举措,展示了苹果在人工智能技术上的雄心和实力。【AiBase提要:】

✨ 苹果计划于明年 3 月推出一款新型壁挂式 AI 平板设备,旨在成为家庭智能控制中心。

🖥️ 新设备配有约 6 英寸的触控屏幕,支持 Siri 和 Apple Intelligence 语音控制。

🤖 该产品将与亚马逊和谷歌的智能家居设备竞争,并计划推出更高级的后续版本。

12、YouTube试水AI音乐重混功能,用指令词即可改编 30 秒热门配乐

YouTube近日推出了名为“Dream Track”的AI音乐重混功能,让创作者可以重新演绎授权歌曲,增强短视频的艺术表现。这一创新将为创作者们带来更多灵感,拓宽音乐创作的边界,为短视频音乐带来更多风格可能性。【AiBase提要:】

🎵 YouTube正在测试“Dream Track”功能,让创作者可以利用AI重塑授权歌曲的风格。

🎤 参与者可选择歌曲并输入指令生成 30 秒的独特配乐,增强短视频的艺术表现。

🎶 目前尚不清楚可重塑的歌曲范围,以及YouTube与哪些音乐厂牌合作。

举报

  • 相关推荐
  • AI日报:昆仑万维天工超级智能体发布;OpenAI核心API支持MCP百度飞桨PaddleOCR 3.0开源

    【AI日报】汇总了近期AI领域重要动态:1)百度飞桨发布PaddleOCR3.0,提升文字识别精度13%;2)昆仑万维发布天工超级智能体,AI办公成本仅为OpenAI的40%;3)OpenAI API新增MCP支持简化开发流程;4)xAI推出实时网页搜索API;5)谷歌Sparkify可将问题秒变动画;6)Mistral发布高效代码模型Devstral;7)Video Ocean推出4K视频生成工具;8)谷歌推出AI内容识别工具SynthID;9)谷歌NotebookLM使用量半年增长56%;10)硅基流动升级128K长文本模型;11)DeepMind发布音乐生成模型Lyria2;12)多模态大模型MMaDA实现跨模态推理;13)微软发布网页智能体Magentic-UI;14)Framer推出AI建站套件。

  • AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。

  • AI日报ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • AI日报阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • OpenAI 推出首款成熟编程 AI 代理 Codex

    Codex 可复制开发环境,单任务耗时最长 30 分钟……

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • 美团AI编程工具“NoCode”即将上线:让编程“像点外卖一样简单”

    美团正加速AI战略布局,即将推出名为"NoCode"的AI编程工具,主打对话式交互实现应用构建,让非技术人员也能轻松开发。该工具由美团研发团队打造,定位"氛围编程"赛道,支持数据分析、原型设计等场景。同时美团还开发了面向专业开发者的AI工具CatPaw,内部使用效果显著。这是美团"AI+工作"战略的重要落地,旨在将AI能力普及至更广泛用户群体。国内大厂纷纷布局AI编程赛道,行业竞争日趋激烈。

  • AI实力排名洗牌:OpenAI、谷歌崛起,Anthropic下滑

    人工智能的格局正以前所未有的速度演变,但超越标准化基准或排行榜平台,了解需求和使用模式 仍然是一个挑战……

  • AI搜索混战:谷歌搜索AI Mode反击,纳米AI中国登顶

    文章探讨了AI搜索领域的变革与竞争。谷歌在ChatGPT发布后意识到威胁,迅速调整战略推出AI Overview功能。目前AI搜索产品主要分为三类:原生AI搜索(如Perplexity)、传统搜索增强AI能力(如New Bing)和大模型厂商的搜索产品(如Kimi)。Perplexity凭借"答案引擎"的创新模式快速崛起,通过优化用户提问方式、提供精准答案并标注信息来源,月活用户突破千万。但这类产品面临�

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。