首页 > 业界 > 关键词  > 谷歌最新资讯  > 正文

AI视野:谷歌推几何模型Alpha Geometry;三星发布AI手机Galaxy S24;Runway更新运动笔刷功能;Midjourney v6下周补齐缩放平移等功能

2024-01-18 15:24 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📈💻💡大模型动态

谷歌推数学几何模型Alpha Geometry

【AiBase提要:】

🥇AlphaGeometry解决复杂几何问题

🧠语言神经模型和规则推理引擎结合

🧩运用高度并行计算寻找解决方案,实力达奥林匹克金牌得主

模型代码:https://github.com/google-deepmind/alphageometry

🤖📱💼AI应用

谷歌推AI搜索功能新功能 画个圈就能搜索

image.png

【AiBase提要:】

🔄 Google在与三星联合发布活动中宣布推出了一种名为“Circle to Search”的新搜索方式。

🌐 “Circle to Search”并非仅限于画圈手势,用户还可以通过其他手势方式启动搜索。

🔍 此功能使用户能够在任何应用中方便地进行搜索。

Runway更新Multi-Motion Brush运动笔刷功能

image.png

【AiBase提要:】

⭐️ 更新了Multi-MotionBrush运动笔刷功能

⭐️ 可同时控制5个物体运动路径

⭐️ 提供更多创作可能性,灵活控制图像动态效果

亚马逊APP测试新AI功能,不仅能解答产品问题还能逗你笑

【AiBase提要:】

💡 新AI功能能解答产品问题

🚀 功能目前处于测试阶段

🤖 也能回答更富创意的查询

Midjourney v6下周将补齐缩放平移及视频生成等功能

【AiBase提要:】

⭐ 下周将推出v6新版本

⭐ 引入缩放、平移和改变区域的能力

⭐ 风格一致性将得到提高

谷歌计划直接在 Bard 中添加 AI 图像生成器

【AiBase提要:】

🎨 Google Bard即将推出自家的图像生成器

🖼️ 用户可以通过Bard轻松创作令人惊艳的图像

🔒 图像生成器注重用户安全,配备安全功能确保使用体验

低成本AI音色克隆软件GPT-SoVITS 完美复刻HeyGen核心功能

image.png

【AiBase提要:】

⭐ 输入5秒声音样本即可转换文字为语音

⭐ 仅需1分钟训练数据实现模型微调

⭐ 支持多语言,集成多种辅助工具

项目地址:https://top.aibase.com/tool/gpt-sovits

PhotoMaker平替?一张照片InstantID几秒钟就能生成个性化图片

image.png

【AiBase提要:】

- InstantID是一项新技术

- 它可以几秒钟内生成不同风格的人物照片

- InstantID不需要复杂的训练或微调过程

项目地址:https://top.aibase.com/tool/instantid

Motion推新功能Video-to-Motion 可通过视频捕捉运动

QQ截图20240118103014.png

【AiBase提要:】

⭐ 通过视频捕捉运动

⭐ 生成各种角色视频

⭐ 可以将视频中的角色替换为3D化身

体验地址:https://discord.gg/AapmuVJqxx

Whimsical:超好用的AI生成思维导图工具

【AiBase提要:】

⭐ 集白板和文档于一体的协作中心

⭐ 提供AI文本转流程图功能

⭐ 为团队会议和交流提供便利

体验地址:https://top.aibase.com/tool/whimsical

📰🤖📢AI新鲜事

三星发布AI手机Galaxy S24

image.png

【AiBase提要:】

🔄 支持谷歌"Circle to Search"功能,通过画圈即可获取图像、视频或文本信息。

🗣️支持13国语言,通话中即时翻译,解放出国语言障碍。

📝 可自动提取要点进行翻译、生成摘要,实现文件整理、思维导图制作、页面风格转化。

非营利组织计划推出Fairly Trained认证计划:确保AI模型生成内容不侵权

【AiBase提要:】

🤖 为那些证明已获得版权许可的AI模型提供认证标签,以防侵犯版权。

⚖️ 已批准并颁发了第一个名为“Licensed Model”认证的标签

🤖生成式AI版权争议一直存在,曾有艺术家和作者起诉多家AI公司侵犯版权

AI图形设计工具Recraft完成1200万美元A轮融资

【AiBase提要:】

🚀 Recraft专注于为专业人士提供图形设计生成工具

🤖 利用自有基础模型实现一致设计元素生成,已吸引30多万用户

🔧 Recraft融资支持构建自己的基础模型,旨在提供图形设计生成工具

CNET的发行商因AI丑闻而难以出售

【AiBase提要:】

🔸CNET没有充分披露AI生成文章

🔸人工智能丑闻导致网站声誉负面影响

🔸出售难题包括品牌声誉问题

👨‍💻💡🎯聚焦开发者

蚂蚁开源ATorch 、 Lookahead两项大模型技术

【AiBase提要:】

🔸 ATorch 是一个大模型分布式训练加速扩展库

🔸 Lookahead 是一个推理加速框架

🔸 ATorch已集成到蚂蚁集团的大模型训练开源产品 DLRover 中

开源地址:

https://github.com/intelligent-machine-learning/dlrover/atorch

https://github.com/alipay/PainlessInferenceAcceleration

LeCun曝多模态LLM重大缺陷 提出Interleaved-MoF显著增强视觉理解能力

【AiBase提要:】

💡 多模态大语言模型MLLM在视觉模式性能差距明显

💡 通过「交错特征混合」方法取得了10.7%的能力增强

💡 研究对于解决当前MLLM在视觉理解方面的缺陷问题具有重要意义

论文地址:https://arxiv.org/pdf/2401.06209.pdf

浙大提出SIFU模型 单图即可重建高质量3D人体模型

image.png

【AiBase提要:】

🧠 SIFU模型创新性使用单张图片进行3D人体模型重建

🌐 引入侧视图条件隐函数和扩散模型

💡 成功解决传统方法中的问题,提高了重建精度和效果

项目地址:https://top.aibase.com/tool/sifu

举报

  • 相关推荐
  • AI日报:Midjourney重磅推出视频生成模型V1;OpenAI将在今年夏季发布GPT-5;谷歌推Search Live语音搜索功能

    本期AI日报聚焦多项AI领域重要进展:1) Midjourney推出首款视频生成模型V1,支持21秒视频生成;2) OpenAI CEO确认GPT-5将于今夏发布;3) Google上线语音对话搜索功能Search Live;4) OpenAI开源客户服务代理框架;5) MiniMax发布智能代理Agent;6) 恶意工具WormGPT出现新变种;7) OpenAI推出企业版ChatGPT折扣;8) DeepSite V2支持3D网页动画生成;9) AI工具可秒变PPT;10) 比亚迪与字节跳动合作开发动力电池技术;11) 马斯克否认xAI巨额亏损传闻。

  • AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • 飞猪AI“问一问”更新:升级机酒查询、手绘地图等功能 新增会员助手

    飞猪AI助手"问一问"5月26日更新多项功能:1)提升智慧交通、酒店顾问等场景的查询精准度,新增C919国产飞机票务推荐;2)推出AI角色会员助手,可查询会员权益并推荐高性价比方案;3)优化基础功能,包括搜索提示、一键生成旅行长图等;4)手绘行程地图接入真实数据,可生成带距离标注的个性化路线图。目前途牛等平台也相继布局AI旅游助手,飞猪产品负责人表示将持续迭代升级,探索AI在旅游领域的无限可能。

  • 纤薄背后 看三星是如何在Galaxy S25 Edge上实现突破的

    三星Galaxy S25 Edge以5.8毫米厚度、163克重量成为迄今最纤薄的S系列旗舰,突破性地重构了智能手机底层设计理念。其采用骁龙8至臻版移动平台,配合定制散热系统使均热板面积增加10%,通过"镂空结构"设计优化热传导路径。影像方面搭载2亿像素主摄,采用双层镜头设计使模组厚度减少超10%,延续了Ultra系列的旗舰成像水准。整机采用钛金属边框与康宁大猩猩玻璃2代,在极致轻薄中实现了性能、影像与耐用性的完美平衡,重新定义了旗舰智能手机的可能性。

  • AI日报:MiniMax推视频生成模型Hailuo 02;Cursor Pro取消500次请求限制;谷歌发布AI模型 Gemini 2.5 Flash-Lite

    本文汇总了AI领域最新动态:1)Cursor Pro取消500次请求限制;2)稀宇科技推出视频生成模型Hailuo02;3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite;4)科大讯飞星火X1升级版7月上线;5)腾讯元宝推出AI编程模式;6)OpenAI将下架GPT-4.5 API;7)苹果Speech API转录速度超Whisper 55%;8)百度推出数字人互动直播间;9)Meta曾试图高薪挖角OpenAI人才;10)Krea1公测开放,解决"AI感"问题;11)特斯拉Grok车载AI助手即将上线;12)谷歌Gemini新增视频分析功能。

  • Meta AI新增生成式AI视频编辑功能:秒换服装、场景

    Meta 宣布,将在Meta AI应用、Meta.AI网站和Edits应用上推出一项生成式AI视频编辑功能。 用户可通过50多种预设AI提示词,一键实现视频中服装、场景、光影等元素的智能变换。 Meta称,全新的AI视频编辑功能直观易用,用户无需任何视频编辑专业知识即可制作高质量的视频。首先,用户可将视频上传到Meta AI应用、Meta.AI网站或

  • 大屏+AI让购物更从容 三星Galaxy Tab S10系列618热销中

    文章探讨了当下消费市场回归理性的趋势,年轻人更注重产品的情绪价值与实用性。三星Galaxy Tab S10系列凭借14.6英寸AMOLED屏幕和AI智能功能成为理性消费的代表:其"即圈即搜"功能可快速识别商品信息,多任务分屏支持同时比价,Bixby助手能分析商品优劣。这款平板既满足情感需求,又通过技术手段帮助消费者做出更明智的购买决策,实现了心动与理性的平衡,让消费成为经得起推敲的生活选择。

  • 三星Galaxy S25 Edge:以极致纤薄 定义旗舰手机科技美学

    三星Galaxy S25 Edge以5.8毫米超薄机身重新定义旗舰手机标准,在163克轻盈设计中融入骁龙8 Gen4移动平台和2亿像素主摄,实现性能与便携的完美平衡。通过钛合金边框和康宁大猩猩玻璃2提升耐用性,配合"镂空结构"散热设计,确保旗舰级性能稳定输出。2亿像素主摄采用重构对焦模组,厚度减少10%,支持8K视频录制。深度整合Galaxy AI技术,提供跨应用智能体验。该机以系统性工程创新突破轻薄与性能的矛盾,为行业树立新标杆,展现三星对未来手机形态的前瞻探索。

  • 三星Galaxy A56 5G:用创新AI体验打造多元便捷生活

    文章介绍了三星Galaxy A56 5G手机如何通过AI技术提升用户体验。该手机搭载超慧智能平台,配备升级版Bixby语音助手,支持多模态感知和跨应用执行能力,能识别图像、文档并调用多个应用程序完成任务。其"即圈即搜"功能可智能识别屏幕内容并提供后续操作选项,还新增音乐识别功能。旅行时,实时视频聊天模式可识别地标建筑并讲解背景故事。影像系统提供智能编辑工具,可去除照片干扰元素、优化合影表情,支持自定义滤镜。AI多截图功能可快速创建GIF动图分享精彩瞬间。这些创新功能使手机成为用户生活的高效智能伴侣。目前618期间购买可享更多优惠。

  • Meta V-JEPA 2模型来袭,OpenAI/微美全息AI创新跃升赋能千行百业变革

    Meta推出开源模型V-JEPA2,帮助AI理解3D环境和物理规律;OpenAI发布最强推理模型o3-pro,在数学测试中超越Google Gemini2.5Pro;苹果宣布将推出全新智能模型,扩展语言支持并开放开发者访问;微美全息凭借技术积累在大模型、多模态智能等领域取得突破。全球科技巨头加速布局AI前沿领域,推动AI与教育、金融等重点行业深度融合,赋能产业升级。