首页 > 业界 > 关键词  > 百度最新资讯  > 正文

AI视野:百度推千帆SDK开源版本;美图推出“AI封面”功能;支付宝上线AI写真功能;三星发布生成式AI模型

2023-11-08 14:19 · 稿源:站长之家

🤖📈💻💡大模型动态

百度智能云千帆大模型平台推出千帆SDK开源版本

百度智能云升级推出免费开源的千帆SDK,包括数据集管理、模型训练、模型评估、服务部署等功能,助用户轻松构建大语言模型应用。

具体操作指引可点击链接查看:

https://github.com/baidubce/bce-qianfan-sdk/blob/main/cookbook/console-finetune/console-finetune.ipynb

【AiBase提要:】

🌟 升级免费SDK:百度智能云推出千帆SDK,全面开源,提供从数据管理到模型应用的全流程支持。

🚀 多功能应用:SDK支持对话补全、续写补全、语义向量等多种应用,助力用户开发大型语言模型应用。

📚 丰富资源:SDK提供实践案例、应用场景的cookbook,扩展了大语言模型应用的基础能力。

三星发布生成式AI模型Samsung Gauss

三星于2023年11月7日首次公开发布了生成式AI模型Samsung Gauss,旨在将其应用于未来的产品,包括语言、代码和图像模型,提高工作效率和用户体验。

image.png

【AiBase提要:】

🔹 三星首次公开发布生成式AI模型Samsung Gauss,用于未来产品。

🔹 Samsung Gauss包括语言、代码和图像模型,提高工作效率和设备控制。

🔹 三星致力于通过自己的AI红队确保AI的安全使用,保护消费者隐私。

思谋科技发布全球首个工业多模态大模型 IndustryGPT V1.0

思谋科技发布了全球首个工业多模态大模型 IndustryGPT V1.0,具备深度行业洞察和精炼数据,可应对制造业问题、识别工业缺陷,并与跨国企业合作推动智能制造进入新时代。

AiBase提要:

1. 🚀 思谋科技发布全球首个工业多模态大模型 IndustryGPT V1.0。

2. 🏭 这一大模型通过深度行业洞察和精炼数据,解答制造业问题、识别工业缺陷,并提供决策支持。

3. 🤝 思谋科技与跨国企业签署战略合作协议,共同推动全球工业制造进入智能时代。

🤖📱💼AI应用

美图旗下开拍APP推出“AI封面”功能

美图旗下开拍APP推出“AI封面”功能,利用智能生成技术根据图片和文案,帮助视频创作者更高效地制作爆款封面,包括图文生成和视频生成封面,同时支持文案润色。

微信截图_20231108113216.png

【AiBase提要】:

1. “AI封面”是美图公司推出的功能,可以根据图片和文案智能生成视频封面,提高视频创作者的创作效率。

2. 用户只需上传照片和输入封面文案,系统即可生成十款爆款封面,并支持智能优化字体颜色、边框等,满足个性化需求。

3. 对于不擅长写封面文案的创作者,该功能还提供AI文案润色服务,降低了封面制作门槛。

支付宝上线新功能:免费生成AI写真 还可导出高清图

支付宝推出免费AI写真功能,用户可生成多种风格的照片,还支持导出高清图,并允许指定生成不同性别的自己。

支付宝上线新功能:免费生成AI写真 还可导出高清图

【AiBase提要】

💡 支付宝新增AI写真功能,限时免费,每日登录可获得10张胶片,1张可生成4张写真。

💡 用户可选择不同风格的写真,包括古风、杂志风、航天员风格等。

💡 支付宝AI写真支持导出高清图,但保存1张照片需要扣除3张胶片。

Google Performance Max推生成式AI广告工具

Google最近推出的Performance Max将AI生成技术引入广告领域,帮助广告商生成高质量的广告内容,包括标题、描述和图像,提供更多的自定义选择和创意自由度。

image.png

【AiBase提要:】

🚀 Google Performance Max引入生成式AI广告工具,帮助广告商轻松创建高质量广告内容。

📝 广告代理和企业可以使用文本提示迭代生成广告,提高广告效果,同时避免生成相同的广告元素。

📷 AI驱动的图片编辑功能提供广告资源的图片部分编辑,提高广告吸引力,并简化创意审查流程。

PopSockets推AI定制工具 支持用户定制手机壳

智能手机外壳和配件制造商PopSockets推出AI定制工具,使用大型模型引擎,让用户个性化手机壳、手柄和钱包,并奖励最佳AI艺术作品。这一创新利用人工智能技术,提供更多创意可能性。

【AiBase提要】

1. PopSockets的AI定制工具基于大型模型引擎,允许用户个性化手机配件。

2. PopSockets举办竞赛,奖励最佳AI艺术作品,推动创造性。

3. 使用PopSockets Customizer AI,用户可以轻松创建专业照片,为产品添加文本或贴纸,提供独特的设计体验。

Plai Labs推文本到视频生成器PlaiDay

Plai Labs最新推出的PlaiDay是一款文本到视频生成工具,允许用户通过上传自拍照片并输入一些文字,生成个性化的短视频,基于AI平台Orchestra的技术开发。

image.png

地址:https://plaiday.io/app/

【AiBase提要】:

📌 Plai Labs推出PlaiDay工具,允许用户生成个性化短视频。

📌 Orchestra平台支持合作和连接的AI工具,不仅限于艺术创作。

📌 Plai Labs的技术为各行业提供AI应用,拓宽了AI技术的应用范围。

📰🤖📢AI新鲜事

B站UP主用“弱智吧”测试AI智商 整活视频获赞超71万

B站UP主“精致的男孩富贵”展示国内大型语言模型的智商测试,通过提出毫无逻辑的问题来考察人工智能的智能水平。结果显示大型语言模型在逻辑推理方面存在明显不足。视频获得超过71.1万的播放量和6.6万的点赞。

image.png

【AiBase提要:】

1. B站UP主测试大型语言模型智商,以“弱智吧”问题考察人工智能。

2. 人工智能在面对无逻辑问题时表现出逻辑能力的不足。

3.通过数据和算法改进,人工智能的推理和决策能力有望提高。

AI一分钟演绎普通女孩的一生 抖音获赞353.8万

抖音博主“Mae”的视频《大多数普通女孩的一生》在一分钟内温暖展示了女孩从出生、上学、工作、结婚、怀孕、生子、退休的生命历程,获得353.8万点赞,23.8万网友评论,收藏转发数超264万。

image.png

【AiBase提要:】

🎥 视频温暖展现女孩一生:抖音博主“Mae”的视频在短短一分钟内生动展示了女孩的成长经历。

👍 社交媒体成功:该视频获得了超过350万点赞和数十万评论,触动了众多网友。

🤖 AI技术应用:视频反映了AI技术的快速发展,博主还制作了其他类似视频,受到欢迎。

Adobe回应有关AI生成加沙爆炸图像的争议

Adobe在拜登总统关于AI潜在社会危害的讲话后,对未标记为AI生成的加沙爆炸图像争议进行了回应。

【AiBase提要:】

💬 Adobe回应争议:Adobe就涉及未标记为AI生成的加沙爆炸图像争议发布声明,强调其库存图像标记要求。

🖼️ 图像争议引发抵制:澳大利亚媒体报道此图像,引发社交媒体上的抵制浪潮,涉及Adobe Stock上的其他逼真加沙图像。

👥 平台受到影响:争议导致库存图像贡献者担忧,认为涌入的生成AI图像损害了Adobe Stock平台,Adobe强调尊重第三方权利。

微软将租用Oracle的GPU超级集群以满足Bing Chat的GPU需求

微软计划将Bing搜索中的机器学习模型部分迁移到Oracle的GPU超级集群,以满足Bing Chat生成式AI聊天机器人的高需求,加强其AI服务。

【AiBase提要:】

🔸 微软与Oracle合作将Bing搜索中的机器学习模型部分迁移到GPU超级集群,以支持Bing Chat的高GPU需求。

🔸 合作旨在提高搜索速度和扩展客户访问,涵盖微软与Oracle在云基础设施领域的合作。

🔸 Oracle的GPU集群提供成千上万的Nvidia A100和H100GPU租赁,以满足微软的计算资源需求。

寒武纪与百川智能完成大模型适配

寒武纪的思元(MLU)云端智能加速卡与百川智能的大模型完成全面适配,加速了大模型从训练到部署的流程,提供了更高性能。

【AiBase提要】

1. 寒武纪思元(MLU)云端智能加速卡成功适配百川智能的大模型,提高了性能。

2. 合作涵盖多领域,包括大语言模型和视觉大模型。

3. 合作计划推动大模型在不同行业和场景的广泛应用。

人类或于2028年推出首个AGI?谷歌DeepMind提6条AGI标准

谷歌DeepMind的Shane Legg团队发布了AGI时间表论文,预测到2028年,有50%的可能性开发出首个AGI,同时提出AGI的6个标准和5个等级。

【AiBase提要:】

📅 AGI时间表:Shane Legg团队预测人类可能在2028年开发出首个AGI,引发广泛关注。

📚 定义标准:论文提出AGI的6个标准,包括性能、通用性、认知任务等,为AGI测评提供指导。

🤖 大语言模型:现代大语言模型已经迈向AGI雏形,展现出元认知能力和广泛任务完成潜力。

投资 Hugging Face 的 IBM 启动5亿美元企业人工智能风险基金

IBM宣布启动5亿美元的风险投资基金,专注于投资人工智能公司,以加速生成式人工智能技术的研究和应用。

【AiBase提要】

🚀 IBM启动5亿美元风险投资基金,专注于人工智能公司。

💡 基金将支持全球企业实现人工智能商业潜力。

🤝 IBM积极投资于Hugging Face等领先人工智能公司。

OpenAI发布ChatGPT更新或导致部分AI初创公司倒闭

OpenAI发布的最新ChatGPT更新可能让围绕PDF分析构建的多家AI公司失去竞争力,引发担忧,尤其是包装器的添加可能影响小型AI初创公司。

ℹ️ 【AiBase提要】:

1️⃣ OpenAI的最新更新引发担忧,特别是包装器的添加,可能影响小型AI初创公司,尤其是那些围绕PDF分析构建的公司。

2️⃣ 这一举措引发了一些公司的担忧,包括Stripe产品负责人Sahar Mor的担忧,他认为这可能导致一些车载人工智能公司倒闭。

3️⃣ OpenAI作为最大的大型语言模型开发者,具备资源来应对监管要求,而规模较小的AI初创公司可能受到监管的抑制。

👨‍💻💡🎯聚焦开发者

清华、中科院、MIT联合提出Co-Pilot人机交互框架

清华、中科院和MIT的科研人员合作研发了Co-Pilot人机交互框架,首次将大语言模型用于辅助驾驶,以描述方式控制车辆行动轨迹,并成功满足乘客的意图。

image.png

论文地址:https://www.researchgate.net/figure/Co-Pilot-for-path-tracking-control-The-system-consists-of-three-modules-the-Reference_fig2_374800815

【AiBase提要:】

🚗 首次尝试使用语言模型辅助驾驶,以描述方式控制车辆轨迹。

🤖 Co-Pilot人机交互框架能够理解和满足乘客的意图。

🔬 这项研究揭示了大语言模型在自动驾驶领域的应用潜力,为未来研究提供了方向。

斯坦福大学提出RT-Sketch 手绘轮廓助机器人完成任务

斯坦福大学研究人员提出了RT-Sketch,一种目标导向操作策略,使用手绘草图作为机器人任务规范,改进了视觉任务中的机器人操作。

image.png

项目地址:https://rt-sketch.github.io/

【AiBase提要】

📌 RT-Sketch是一目标导向策略,使用手绘草图作为机器人任务规范,提高了任务的准确性。

📌 研究人员使用生成对抗网络将图像转化为草图,构建了训练数据集,使RT-Sketch能够接受不同精细程度的草图作为输入。

📌 RT-Sketch在处理模糊语言目标或视觉干扰时表现出色,为人机交互和机器人技术带来了新可能性。

多模态音乐AI框架Video2Music 为视频生成情感相符的音乐

多模态音乐AI框架Video2Music 利用前沿Transformer模型,根据视频内容生成情感相符的音乐,为视频创作者提供更好的音乐配乐选项。

image.png

项目地址:https://github.com/amaai-lab/video2music

【AiBase提要】

🎵 Video2Music使用Transformer架构生成音乐,确保音乐与视频内容匹配。

🎶 利用独特的数据集和验证的转换器模型,捕捉视频中的情感变化并转化为音乐情感表达。

🎥 为用户创造更个性化和情感丰富的音乐与视频体验,为未来音乐和视频领域带来更多可能性。

新NeRF技术: 视频转化为可控制的3D模型

Fraunhofer Heinrich Hertz研究团队引入NeRF技术,将标准RGB视频转化为可控制的3D人体模型,降低数字人物模型制作成本,拓展电影、游戏、虚拟现实等领域的应用可能。

image.png

【AiBase提要】:

1. Fraunhofer Heinrich Hertz研究团队使用NeRF技术简化数字人物创建,从标准RGB视频生成可控制的3D人体模型。

2. NeRF技术通过预测光线与场景的交互创造逼真的3D图像,提供新途径实现多角度人物动作。

3. 这项创新有望降低数字人物模型制作成本,对电影、游戏、虚拟现实等领域带来积极影响,拓展应用可能性。

中国研究人员推ControlLLM框架:提升大语言模型处理多模态任务能力

中国的研究人员提出ControlLLM框架,旨在增强大型语言模型处理复杂多模态任务,提高准确性和效率。

image.png

【AiBase提要】

🔍 中国研究人员提出ControlLLM框架,用于增强大型语言模型(LLMs)在处理复杂任务中的表现。

🔍 ControlLLM通过任务分解、Thoughts-on-Graph方法和多功能执行引擎提高工具利用的准确性和效率。

🔍 这一创新提高了多模态任务的成功率,使LLMs能够更好地处理包括图像、音频和视频在内的不同信息类型。

举报

  • 相关推荐
  • 百度第一!百度智能云一见领跑视觉大模型赛道

    IDC最新报告显示,百度智能云凭借"文心一言4.5"多模态大模型和"文心X1"深度思考模型,在视觉大模型领域综合实力排名第一。其智能云平台在算法模型、工程化落地、行业覆盖等方面优势显著,已服务餐饮、钢铁、电力等20多个行业,帮助数百家企业实现生产全环节的数字化管理。典型案例包括:为风电集团构建安全管控系统,巡检效率提升6-10倍;与中钢研合作金相分析模型,检测准确率达95%;助力连锁餐饮实现全国1000+门店服务质量量化管理,订单覆盖率从5%提升至95%。通过"云端大模型+边缘小模型"的协同架构,在保障精度的同时大幅降低应用成本,推动专业级视觉AI应用普及。

  • 问道未有穷期 星海即是归途 | 2025百度商业AI技术创新大赛圆满收官

    2025百度商业AI技术创新大赛圆满落幕,聚焦AI技术与商业实践深度融合。赛事吸引2500多支队伍参与,覆盖广告生成式序列化推荐、视频生成推理优化等三大赛道。高校团队表现亮眼,重庆邮电大学、西安电子科技大学等获一等奖。大赛推动产教融合,展现AI在商业应用的前沿突破,助力青年创新者实现技术思维转变,共同期待AI赋能个性化表达与创意平权未来。

  • 百度2025第二季度营收327亿元 AI新业务收入超100亿元

    今日,百度正式对外发布2025年第二季度(Q2)财报,多项业务数据表现亮眼,尤其在AI新业务领域呈现出强劲的增长态势。 财报显示,百度在2025年二季度总营收达到327亿元,其中百度核心营收为263亿元。值得关注的是,AI新业务收入超过100亿元,与去年同期相比增长了34%,成为推动百度营收增长的重要力量。

  • 夸克月人均打开65次 断层领先 是百度的6倍以上

    在QuestMobile 2025年AI应用市场半年报中,夸克的AI搜索插件以月人均64.9次的使用频次,遥遥领先其他AI搜索引擎。 这一数据不仅远超同类产品,更是百度AI搜索的6倍以上,展现出断层领先的用户粘性。

  • AI日报:GPT-5正式发布;百度将推文心5.0大模型;知网发布AIKBase V2.0多模态数据管理系统

    《AI日报》精选AI领域最新动态:1)OpenAI发布GPT-5模型,具备强大多模态能力但推理任务仍有局限;2)知网推出AIKBase V2.0多模态数据管理系统;3)Ideogram新增"角色"功能实现图像风格统一;4)Cursor发布CLI版本支持终端AI编程;5)百度即将推出全新推理模型和文心5.0大模型;6)dots.ocr推出1.7B参数多语言文档解析工具;7)特斯拉解散Dojo超算团队转向英伟达合作;8)谷歌Pixel 10引入AI相�

  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

  • 百度搜索PC端全量上线AI功能

    百度对外宣布其搜索PC端首页已完成全量升级,将传统信息入口一举升级为任务中枢,为用户带来前所未有的智能搜索体验,进一步巩固了其在国内AI搜索行业的领先地位。 此次升级后的百度搜索PC端首页亮点纷呈。新增的“超级智能双行框”成为一大核心亮点,它支持用户一键进行深度搜索,无论是面对复杂的专业问题,还是多维度信息需求,都能快速给出精准且全面的解答

  • AI日报:昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索;Grok 4 AI模型永久免费开放

    AI日报栏目聚焦人工智能领域最新动态:1)昆仑万维发布SkyReels-A3模型,实现语音驱动数字人生成;2)xAI宣布Grok4模型永久免费开放;3)OpenAI发布GPT-5提示词指南;4)百度PC端上线AI搜索功能;5)微软Windows Co pilot接入GPT-5;6)百川智能开源医疗大模型Baichuan-M2性能超越GPT-oss120b;7)苹果iOS26将集成ChatGPT-5;8)谷歌推出3D视觉编辑框架BlenderFusion;9)轻量级TTS模型Kitten TTS参数仅1500万;10)MiniCPM-V

  • 深耕智慧物流!安得智联四度蝉联中国物流企业50强

    2025年8月20-22日,中国物流与采购联合会等机构在包头举办物流发展论坛,聚焦行业政策解读与高质量发展路径。会议发布“2025中国物流企业50强”等榜单,500余位代表参会。重点企业安德智联凭借供应链科技创新,连续四年入围双榜单,其“1+3”服务模式提供端到端数字化解决方案,覆盖制造端、流通端及末端的全链路服务,助力行业降本增效。未来将持续引领供应链服务升级,推动物流业高质量发展。

  • 百利好:清晰视界 守护光明

    文章聚焦全球儿童视力健康问题,指出目前全球约140万儿童失明、700万视力低下,中国视力障碍儿童占比1.56%。视力问题严重影响儿童身心发展,给家庭和社会带来沉重负担。百利好慈善基金会与奥比斯合作推出为期三年的"中国儿童综合眼部健康计划",重点包括:加强县级儿童眼科服务,优化眼健康转诊网络,推广全面眼保健。计划将通过设备支持、技术培训、健康教育等方式,提升基层医疗能力,重点关注农村地区儿童视力健康。自1982年以来,奥比斯已帮助数万名患者恢复视力。该计划旨在实现"让每个孩子看清世界"的愿景,需要社会各界共同关注与支持。

今日大家都在搜的词:

热文

  • 3 天
  • 7天