首页 > 业界 > 关键词  > 谷歌最新资讯  > 正文

AI视野:谷歌推几何模型Alpha Geometry;三星发布AI手机Galaxy S24;Runway更新运动笔刷功能;Midjourney v6下周补齐缩放平移等功能

2024-01-18 15:24 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📈💻💡大模型动态

谷歌推数学几何模型Alpha Geometry

【AiBase提要:】

🥇AlphaGeometry解决复杂几何问题

🧠语言神经模型和规则推理引擎结合

🧩运用高度并行计算寻找解决方案,实力达奥林匹克金牌得主

模型代码:https://github.com/google-deepmind/alphageometry

🤖📱💼AI应用

谷歌推AI搜索功能新功能 画个圈就能搜索

image.png

【AiBase提要:】

🔄 Google在与三星联合发布活动中宣布推出了一种名为“Circle to Search”的新搜索方式。

🌐 “Circle to Search”并非仅限于画圈手势,用户还可以通过其他手势方式启动搜索。

🔍 此功能使用户能够在任何应用中方便地进行搜索。

Runway更新Multi-Motion Brush运动笔刷功能

image.png

【AiBase提要:】

⭐️ 更新了Multi-MotionBrush运动笔刷功能

⭐️ 可同时控制5个物体运动路径

⭐️ 提供更多创作可能性,灵活控制图像动态效果

亚马逊APP测试新AI功能,不仅能解答产品问题还能逗你笑

【AiBase提要:】

💡 新AI功能能解答产品问题

🚀 功能目前处于测试阶段

🤖 也能回答更富创意的查询

Midjourney v6下周将补齐缩放平移及视频生成等功能

【AiBase提要:】

⭐ 下周将推出v6新版本

⭐ 引入缩放、平移和改变区域的能力

⭐ 风格一致性将得到提高

谷歌计划直接在 Bard 中添加 AI 图像生成器

【AiBase提要:】

🎨 Google Bard即将推出自家的图像生成器

🖼️ 用户可以通过Bard轻松创作令人惊艳的图像

🔒 图像生成器注重用户安全,配备安全功能确保使用体验

低成本AI音色克隆软件GPT-SoVITS 完美复刻HeyGen核心功能

image.png

【AiBase提要:】

⭐ 输入5秒声音样本即可转换文字为语音

⭐ 仅需1分钟训练数据实现模型微调

⭐ 支持多语言,集成多种辅助工具

项目地址:https://top.aibase.com/tool/gpt-sovits

PhotoMaker平替?一张照片InstantID几秒钟就能生成个性化图片

image.png

【AiBase提要:】

- InstantID是一项新技术

- 它可以几秒钟内生成不同风格的人物照片

- InstantID不需要复杂的训练或微调过程

项目地址:https://top.aibase.com/tool/instantid

Motion推新功能Video-to-Motion 可通过视频捕捉运动

QQ截图20240118103014.png

【AiBase提要:】

⭐ 通过视频捕捉运动

⭐ 生成各种角色视频

⭐ 可以将视频中的角色替换为3D化身

体验地址:https://discord.gg/AapmuVJqxx

Whimsical:超好用的AI生成思维导图工具

【AiBase提要:】

⭐ 集白板和文档于一体的协作中心

⭐ 提供AI文本转流程图功能

⭐ 为团队会议和交流提供便利

体验地址:https://top.aibase.com/tool/whimsical

📰🤖📢AI新鲜事

三星发布AI手机Galaxy S24

image.png

【AiBase提要:】

🔄 支持谷歌"Circle to Search"功能,通过画圈即可获取图像、视频或文本信息。

🗣️支持13国语言,通话中即时翻译,解放出国语言障碍。

📝 可自动提取要点进行翻译、生成摘要,实现文件整理、思维导图制作、页面风格转化。

非营利组织计划推出Fairly Trained认证计划:确保AI模型生成内容不侵权

【AiBase提要:】

🤖 为那些证明已获得版权许可的AI模型提供认证标签,以防侵犯版权。

⚖️ 已批准并颁发了第一个名为“Licensed Model”认证的标签

🤖生成式AI版权争议一直存在,曾有艺术家和作者起诉多家AI公司侵犯版权

AI图形设计工具Recraft完成1200万美元A轮融资

【AiBase提要:】

🚀 Recraft专注于为专业人士提供图形设计生成工具

🤖 利用自有基础模型实现一致设计元素生成,已吸引30多万用户

🔧 Recraft融资支持构建自己的基础模型,旨在提供图形设计生成工具

CNET的发行商因AI丑闻而难以出售

【AiBase提要:】

🔸CNET没有充分披露AI生成文章

🔸人工智能丑闻导致网站声誉负面影响

🔸出售难题包括品牌声誉问题

👨‍💻💡🎯聚焦开发者

蚂蚁开源ATorch 、 Lookahead两项大模型技术

【AiBase提要:】

🔸 ATorch 是一个大模型分布式训练加速扩展库

🔸 Lookahead 是一个推理加速框架

🔸 ATorch已集成到蚂蚁集团的大模型训练开源产品 DLRover 中

开源地址:

https://github.com/intelligent-machine-learning/dlrover/atorch

https://github.com/alipay/PainlessInferenceAcceleration

LeCun曝多模态LLM重大缺陷 提出Interleaved-MoF显著增强视觉理解能力

【AiBase提要:】

💡 多模态大语言模型MLLM在视觉模式性能差距明显

💡 通过「交错特征混合」方法取得了10.7%的能力增强

💡 研究对于解决当前MLLM在视觉理解方面的缺陷问题具有重要意义

论文地址:https://arxiv.org/pdf/2401.06209.pdf

浙大提出SIFU模型 单图即可重建高质量3D人体模型

image.png

【AiBase提要:】

🧠 SIFU模型创新性使用单张图片进行3D人体模型重建

🌐 引入侧视图条件隐函数和扩散模型

💡 成功解决传统方法中的问题,提高了重建精度和效果

项目地址:https://top.aibase.com/tool/sifu

举报

  • 相关推荐
  • 谷歌Pixel 10系列发布:首发Tensor G5芯片 售价799美元起

    今日凌晨,谷歌Pixel10系列正式发布,该系列包含Pixel10、Pixel10Pro及Pixel10Pro XL三款直板旗舰机型,起售价定为799美元(约合人民币5733元)。与此同时,谷歌还推出了首款折叠屏旗舰Pixel10Pro Fold,进一步丰富了产品线。 在设计语言上,Pixel10系列延续了上代的经典

  • 全球首款防尘折叠屏!谷歌Pixel 10 Pro Fold发布:12900元起

    今天凌晨,谷歌新款折叠屏Pixel 10 Pro Fold正式发布,这是全球首款支持防尘的折叠屏旗舰,起售价1799美元(约合人民币12900元)。 据悉,谷歌Pixel 10 Pro Fold拥有IP68防护等级,这意味着它能完全防尘防水,谷歌在防护能力方面引领行业。

  • 量子机器学习或“搅动”芯片制造,谷歌/微美全息攻关突破取得阶段性成果

    澳大利亚科研团队开发出结合人工智能和量子计算原理的新型量子机器学习技术,可能改变微芯片制造方式。该技术仅需5个量子比特,性能优于7种经典机器学习算法,可立即应用于现有量子架构。2023年量子计算领域取得多项突破:微软成功创建拓扑量子比特,D-Wave量子退火处理器性能超越经典模拟器,谷歌量子AI团队探讨扩展超导量子计算机面临的挑战。量子科技正从理论研究迈向工程实现阶段,微美全息(WIMI.US)等企业积极推进量子密码生成器、QGAN技术等研发,有望为数据安全提供更高保障。量子技术发展已进入关键时期,将推动行业进入更安全可靠的发展阶段。

  • 苹果被贴脸开大:AI跳票后被谷歌公开嘲讽

    今天谷歌发布一则广告片,谷歌在这则广告中就苹果AI跳票进行了嘲讽,喊话苹果用户应该购买Pixel 10系列智能手机。 谷歌在广告片中表示,如果你因为某个即将推出”的功能去购买一部新手机,如今这个即将推出”的时间已经持续了一整年,要么你需要重新定义即将推出”,要么你直接换一部手机。 此前在2024年苹果全球开发者大会上,苹果展示了由Apple Intelligenc驱动的个性

  • 报价345亿美元!AI新贵公司计划收购谷歌旗下Chrome浏览器

    美国AI搜索新贵Perplexity正考虑以高达345亿美元的全现金方式,收购谷歌旗下拥有逾30亿用户的Chrome浏览器。 成立仅三年、总部位于旧金山的Perplexity(由阿拉温德斯里尼瓦斯等人创立),专注于生成式AI搜索引擎,直接挑战谷歌和微软必应。 截至2024年4月,其月活跃用户约1500万,主要依靠付费订阅盈利。这家初创公司已从英伟达、软银集团等巨头筹集约10亿美元融资,最新估值

  • 谷歌Pixel 10 Pro XL渲染图曝光:两大配色 8月20日发布

    谷歌Pixel 10 Pro XL的官方宣传渲染图近日曝光,新机将于8月20日发布,还剩不到2周的时间。 此次谷歌Pixel 10 Pro XL提供了月石”(Moonstone)和黑曜石”(Obsidian)两种配色,分别呈现柔和的浅灰蓝色调和经典的暗灰配金属高光边框设计。 机身右侧依旧是电源键与音量键组合,背部为横向延展的胶囊形三摄模组,内含闪光灯及红外温度传感器,整体厚度与重量与上代基本一致。 �

  • 谷歌Pixel Watch 4外观揭晓:41/45mm双尺寸、5款配色

    谷歌Pixel Watch 4智能手表的官方渲染图目前已提前曝光,此次Pixel Watch 4提供了41mm和45mm两种尺寸,以满足不同用户的需求。 其中,41mm版本拥有黑曜石、瓷器白、柠檬绿和鸢尾紫四种颜色,而45mm版本则提供黑曜石、瓷器白和月光石三种颜色。 从曝光的渲染图来看,Pixel Watch 4的设计延续了谷歌一贯的简约风格,同时在色彩搭配上更加大胆和时尚。

  • 谷歌DeepMind发布Genie 3世界模型:支持实时生成交互式3D环境

    据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�

  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

  • AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

    【AI日报】汇总了最新AI领域动态:1)腾讯开源混元系列小尺寸模型,适用于消费级显卡;2)昆仑万维发布推理大模型MindLink,提升回答透明度;3)B站推出AI原声翻译功能,保留UP主音色;4)谷歌Gemini 2.5在数学奥赛夺金,展现强大推理能力;5)OpenAI展示GPT-5网络信息整合特性;6)苹果组建AI团队挑战ChatGPT;7)高德地图推出全球首个AI原生地图应用;8)Adobe推出AI图像合成工具Harmonize;9)NVIDIA发布革命性视频渲染技术;10)谷歌推出Android Studio免费AI编程助手;11)开源结构化信息提取工具LangExtract;12)Figma开发者模式升级提升设计转代码效率。

今日大家都在搜的词: