首页 > 业界 > 关键词  > Grok-2最新资讯  > 正文

AI日报:xAI发布Grok-2,能画图、编码、查新闻;谷歌携Gemini Live、Pixel 9登场;快手推出智能对话应用飞船

2024-08-14 15:06 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、马斯克旗下xAI发布Grok-2和Grok-2mini测试版

埃隆·马斯克旗下xAI公司今日发布了Grok-2和Grok-2mini的测试版,这两款新型AI模型在推理能力方面有显著提升,但也伴随着潜在的风险和挑战。新版Grok AI将为X社交网络带来一系列AI驱动的新功能,包括图像生成等。

image.png

【AiBase提要:】

🚀 Grok-2和Grok-2mini是重大升级,在聊天、编码和推理方面有突破性进展。

🔍 Grok的图像生成功能引发广泛关注,可能面临政治虚假信息传播压力。

💡 xAI计划在X平台上部署多项AI驱动功能,包括改进的搜索功能和回复系统。

2、对标GPT-4o!谷歌携Gemini Live登场

Gemini Live是谷歌推出的一款生成式AI助手,提供了更高度的便捷性和人性化互动体验。它能与用户自由流畅地对话,支持免提使用,集成多种谷歌应用,提供日常帮助。Gemini完全融入安卓用户体验,具备上下文感知能力。谷歌引入Gemini1.5Flash模型以提高响应速度和质量。Gemini作为Google Pixel9的默认助手,展示了AI驱动助手的潜力和智能化发展。

【AiBase提要:】

🤖 Gemini Live提供自由流畅的对话体验,支持免提使用,如口袋里的聊天助手。

📱 Gemini集成多种谷歌应用,提供日常帮助,无需在不同应用间切换。

⚡ 谷歌引入Gemini1.5Flash模型以提高响应速度和质量,持续优化用户体验。

详情链接:https://blog.google/products/gemini/made-by-google-gemini-ai-updates/

3、AI加持!谷歌Pixel 9系列手机发布:搭载Tensor G4芯片 支持Gemini

谷歌发布Pixel 9系列智能手机,搭载AI助手Gemini,引入大语言模型人工智能技术,提升用户体验和设备性能。新机配备Tensor G4芯片,高内存容量,强大AI运行能力。价格适中,功能丰富。Gemini深度整合入安卓系统,提供覆盖层功能,即将扩展到iOS系统。新增卫星SOS功能,提供紧急救援服务。

image.png

【AiBase提要:】

📱 Pixel 9系列包括Pixel9、Pixel9Pro、Pixel9Pro XL和Pixel9Pro Fold,配备Tensor G4芯片,高内存容量,满足AI需求。

📸 摄像头配置高规格,Pro版本支持5倍光学变焦和30倍数字变焦。

🚀 Gemini深度整合入安卓系统,提供覆盖层功能,即将扩展到iOS系统。

4、谷歌发布AI文生图应用Pixel Studio

谷歌公司推出的Pixel Studio应用将彻底改变图像创作和编辑方式,以2秒内生成各种风格的图像为亮点。该应用便捷强大,提供丰富多样的图像创作功能,基于Imagen3模型和Tensor G4SoC芯片,支持云端Gemini模型生成。与竞争对手不同,Pixel Studio功能包含在Pixel9系列设备初始购买价格中,具有市场优势。

【Ai 提要:】

🌟 Pixel Studio 基 Imagen3 模型,2 秒生成多种风图像。

🛠️ 应用内置 AI 编辑工具,支持快速和创作图像。

💰 所有功能无额外费用,提升 Pixel9 系列市场竞争力。

详情链接:https://top.aibase.com/tool/imagefx

5、快手推出智能对话应用飞船

快手科技推出的智能对话应用飞船(Kraft)旨在为用户提供个性化的交互体验,通过文字或语音与虚拟角色进行互动,满足用户的需求,提升生活质量和工作效率。飞船应用基于快手自研的快意模型,具有快速响应速度和逼真的语音体验,支持用户自定义虚拟角色,打造个性化互动乐趣。

image.png

【AiBase提要:】

🚀 飞船应用提供个性化交互体验,用户可通过文字或语音与虚拟角色进行互动,解答疑问、获取娱乐、进行创作。

👩‍✈️ 用户在飞船平台上扮演船长角色,由名为快快的虚拟少女领航员引导体验,体验更加生动有趣。

💬 飞船主要功能包括自然语言对话、个性化虚拟角色创建、内容创作辅助,满足用户的各种需求。

详情链接:https://www.spaceshipapp.cn/#/

6、Opera One浏览器正式登陆iPhone,AI功能助力全新体验!

Opera One浏览器正式登陆iPhone平台,引入AI技术为用户带来更智能的上网体验。用户可以通过AI功能实现更便捷的搜索、标签比较和浏览历史查询,提升了用户的浏览效率和体验。

image.png

【AiBase提要:】

🌟 新上线的Opera One浏览器在iOS上实现了AI功能,提升了用户的搜索体验。

🛍️ 新增的“标签比较”功能让网购变得更加高效,用户可以轻松对比不同商品信息。

🔍 AI驱动的历史记录查询功能,用户只需提问即可找回之前访问过的网站。

7、ChatGPT已经悄悄使用新的GPT-4o模型

ChatGPT官方在社交网络X上低调宣布开始使用新的GPT-4o模型,根据用户反馈更新。新模型改进表现更佳,能进行更详细的推理和支持图像生成,提升生成质量与效率。部分用户对更新持批评态度,认为变化不够显著。

【AiBase提要:】

🌟 新款GPT-4o模型上线,基于用户反馈进行修改。

🤖 用户发现模型表现更佳,能进行更详细的分步推理。

🖼️ 新模型支持图像生成,提升生成质量与效率。

8、腾讯QQ浏览器推出教育辅助工具“AI作文辅导”

腾讯公司最新推出的“AI作文辅导”工具在QQ浏览器上免费开放使用,为学生提供个性化的作文辅导,涵盖小学到高中所有年级。学生可以输入作文题目,AI将分步输出立意、提纲、素材和范文,帮助构建写作逻辑。功能包括题目分析、多种立意选择、提纲和丰富素材。除作文辅导外,QQ浏览器还提供全学段个性化辅导和强大智能工具,提高学习和办公效率。

image.png

【AiBase提要:】

📚 腾讯公司推出的“AI作文辅导”工具在QQ浏览器上免费开放使用,涵盖小学到高中所有年级。

📝 学生只需输入作文题目,AI即可输出立意、提纲、素材和范文,帮助构建写作逻辑。

💡 AI作文辅导功能包括题目分析、多种立意选择、提纲和丰富素材,提供个性化作文辅导体验。

9、谷歌推出“Add Me”功能 合照再也不担心少一人了

谷歌在今年的Made By Google盛会上推出了令人瞩目的新功能“Add Me”,通过结合AI和增强现实技术,解决了集体照片中摄影师无法出现在镜头里或想让拍照者也加入的问题。这项创新技术让每个人都能参与到合照中,无需找陌生人帮忙拍照,改变了拍摄集体照的方式。

【AiBase提要:】

📸 谷歌推出“Add Me”功能,通过AI和增强现实技术实现合并两张照片为一张完美影像

🤳 摄影师拍摄一张没有自己的照片,另一人再拍一张照片,Pixel将两张照片合并,确保每人都在一张照片里

🔍 “Add Me”功能能将第三人完美融入合照中,但最好避免太大幅度的动作以避免合成变形

10、Eleven Labs推出全托管AI自动配音服务

Eleven Labs推出全托管AI自动配音服务,为内容创作者和企业提供了突破语言障碍的创新解决方案。该服务具有多语言支持能力,拓展了视频内容的受众群体,保持原有个人特色的声音复制能力提升了内容的真实感和亲和力。虽然唇形同步仍有改进空间,但这项服务为跨语言内容制作开辟了新可能性,降低了相关成本。

【AiBase提要:】

🌐 多语言支持能力拓展受众群体,助力跨文化传播。

🎙️ 声音复制能力保持原有个人特色,提升内容真实感和亲和力。

👩‍💼 专业配音员验证环节确保翻译质量,引起外国观众共鸣。

详情链接:https://top.aibase.com/tool/elevenlabs

11、成功率高达95.4%!Agent Q横空出世,AI界新秀还是草莓营销大师?

一家名为MultiOn的初创公司发布了Agent Q智能体,成功率高达95.4%,引起广泛关注。CEO频频使用草莓表情,引发联想到OpenAI的Q项目。Agent Q结合搜索、自我反思和强化学习,具备规划和自我修复能力。尽管表现出色,仍有许多讨论和改进空间。

image.png

【AiBase提要:】

🚀 Agent Q成功率高达95.4%,结合搜索、自我反思和强化学习。

🍓 CEO使用草莓表情引发关注,背后或有OpenAI的Q*项目加持。

💡 Agent Q展现强大搜索能力,在真实预订任务中成功率提升至81.7%,仅经过一天自主数据收集。

详情链接:https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities

12、招聘市场变革:求职者大规模使用AI工具

最近调查显示,近50%的求职者利用人工智能工具撰写简历和求职信,给招聘市场带来挑战。雇主警告应届毕业生不要使用AI,但年轻求职者擅长隐藏AI痕迹。付费版ChatGPT使用者在心理测评中表现优异,与社会经济地位相关。

【AiBase提要:】

🌊 近50%的求职者使用AI工具申请工作,导致招聘市场出现低质量申请。

🚫 大型企业零容忍使用AI的求职者,年轻申请者擅长隐藏AI使用。

💰 使用付费版ChatGPT的求职者在心理测评中表现优异,与社会经济地位相关。

13、昆仑万维发布AI流媒体音乐平台Melodio、AI音乐商用创作平台Mureka

昆仑万维公司推出的AI音乐平台Melodio和AI音乐商用创作平台Mureka标志着AI音乐创作技术的新高度。Melodio提供个性化定制音乐服务,满足用户不同场景和情绪下的音乐需求。Mureka为专业艺术家和音乐爱好者提供商用创作和销售渠道,提升音乐创作效率。Skymusic2.0大模型的升级提升了音乐质量和创作边界。

image.png

【AiBase提要:】

🎵 Melodio平台实现个性化定制音乐,根据用户输入提示生成定制化音乐,满足不同情绪和场景下的需求。

🎶 Mureka平台为专业艺术家和音乐爱好者提供商用创作和销售渠道,用户可展示、分享、下载作品并获得收益。

🎼 Skymusic2.0大模型升级提升了音乐质量和创作效率,拓宽了音乐创作的边界。

详情链接:https://top.aibase.com/tool/mureka

举报

  • 相关推荐
  • 大家在看
  • Background Removal AI:使用AI技术快速去除图片背景

    背景去除AI是一个基于人工智能技术的在线服务,它能够快速、准确地从用户上传的图片中去除背景。这项技术特别适用于需要批量处理图片背景去除的电子商务、平面设计、个人照片编辑、房地产摄影以及数字艺术和视频制作等领域。背景去除AI的主要优点包括即时处理、高精度边缘检测、批量处理能力以及支持多种输出格式。它为用户提供了一个简单、高效且成本效益高的解决方案,以满足不同行业和个人对图像编辑的需求。

  • Lyrics Into Song AI:将您的歌词转换成完整的歌曲。

    Lyrics Into Song AI 是一款利用人工智能技术将用户输入的歌词转换成旋律、和声和编曲的在线音乐创作工具。它通过自然语言处理、神经网络架构和音乐生成算法,为创作者提供便捷的音乐创作体验。该产品支持多种音乐风格和语言,适合各种创作需求,无论是社交媒体内容创作、播客开场音乐、视频配乐还是个人活动音乐,都可以通过这个平台轻松实现。

  • CodeCV简历:免费的专业在线Markdown简历制作工具

    CodeCV简历是一个专业的在线简历制作工具,支持Markdown格式,为用户提供多种简历模板和AI辅助写简历功能,帮助用户快速生成个性化、专业的简历。该工具特别适合需要在线制作和导出简历的用户,无论是校招还是社招,都能满足需求。

  • 智语:探索无限智能,构建更完美的聚合之路。

    智语1号是一个以智能系统为基础的聊天平台,提供用户与AI进行互动交流的体验。它利用大模型技术,通过自然语言处理和机器学习,使得AI能够理解和回应用户的各种问题和需求。智语1号的背景是随着人工智能技术的发展,人们对于智能助手的需求日益增长,它旨在为用户提供一个高效、智能的交流环境。产品目前是免费试用,主要面向对智能聊天感兴趣的用户群体。

  • FB Group Extractor:一键抓取Facebook群组成员信息

    FB Group Extractor是一款基于AI技术的Facebook群组成员信息抓取工具,能够帮助用户从Facebook群组中提取、分析并有效利用有价值的信息。该工具支持多种数据提取,包括用户ID、用户名、加入状态、工作职位、位置等,对于市场营销、内容优化和用户研究具有重要意义。它通过Chrome插件的形式提供服务,支持跨平台使用,并且具备免费和付费两种使用方案,满足不同用户的需求。

  • Solidroad:AI驱动的训练和评估平台,提升员工培训效率。

    Solidroad是一个AI优先的训练和评估平台,它将公司的知识库转化为沉浸式培训项目,易于培训者管理,同时为员工提供更吸引人的学习体验。该平台通过个性化支持、指导和专业知识,帮助客户节省时间和资源,加快新员工的熟练速度,并提高客户满意度评分。

  • Docs by Hashnode:动态API文档和产品指南的内容引擎

    Docs by Hashnode是一个为开发者团队设计的API文档和产品指南内容引擎,它允许团队像编写代码一样快速、轻松地构建、定制和扩展他们的文档。它提供了全控制、自定义和Stripe级别的高质量文档,而无需繁重的工作。产品具有现代化的前端、一流的文档编辑器、快速的搜索和发现功能,以及强大的协作和用户反馈工具。

  • Bolna:全天候AI前台接待,接听所有来电

    Bolna是一款AI前台接待系统,旨在无缝地接管和扩展您的前台运营,确保不错过任何来电。它通过创建AI代理、连接知识库、语音实验室、预约安排和报告功能,提供了一个全面的解决方案。Bolna通过提供多种语言支持和集成CRM系统,帮助企业提升客户服务效率和质量。

  • ComfyUI-LumaAI-API:为ComfyUI提供Luma AI API的自定义节点。

    ComfyUI-LumaAI-API是一个为ComfyUI设计的插件,它允许用户直接在ComfyUI中使用Luma AI API。Luma AI API基于Dream Machine视频生成模型,由Luma开发。该插件通过提供多种节点,如文本到视频、图像到视频、视频预览等,极大地丰富了视频生成的可能性,为视频创作者和开发者提供了便捷的工具。

  • Notion-like AI Editor (Lexical):利用Liveblocks、Lexical和Vercel AI SDK构建的协作文本编辑器。

    Notion-like AI Editor是一个基于Liveblocks、Lexical和Vercel AI SDK的协作文本编辑器示例,它允许用户实时同步编辑文档,同时查看彼此的光标位置。该编辑器还集成了AI工具栏,用户可以通过查询AI来生成改进和新内容。

  • StoryMaker:文本到图像生成工具,创造连贯角色故事。

    StoryMaker是一个专注于文本到图像生成的AI模型,能够根据文本描述生成具有连贯性的角色和场景图像。它通过结合先进的图像生成技术和人脸编码技术,为用户提供了一个强大的工具,用于创作故事性强的视觉内容。该模型的主要优点包括高效的图像生成能力、对细节的精确控制以及对用户输入的高度响应。它在创意产业、广告和娱乐领域有着广泛的应用前景。

  • Runway API:使用,随时随地创造视频内容。

    Runway API是一个强大的视频模型平台,提供先进的生成视频模型,允许用户在安全、可靠的环境中嵌入Gen-3 Alpha Turbo到他们的产品中。它支持广泛的应用场景,包括创意广告、音乐视频、电影制作等,是全球顶尖创意人士的首选。

  • NotePlan AI Meeting Notes:自动化会议记录工具,提升会议效率。

    NotePlan AI Meeting Notes 是一款为Google Meet设计的AI驱动会议记录插件,它能够将会议内容自动转化为简洁、可操作的摘要,帮助用户捕捉关键决策、主题和洞见。该插件支持全词转录,用户无需在会议中分心记录,可以完全专注于讨论。它与NotePlan应用无缝集成,可以一键将会议摘要和记录同步至NotePlan,无论是个人还是团队协作,都能提升工作效率。

  • Diarly:安全、简单且美观的日记应用,开启自我发现之旅。

    Diarly是一款专注于个人日记记录的应用程序,它通过提供安全、用户友好且美观的界面,帮助用户记录和回顾个人生活。该应用允许用户通过多种视图如时间线、笔记和日历来轻松导航,同时支持个性化设置,如主题、字体和自定义模板。Diarly还提供了强大的加密和密码保护功能,确保用户隐私安全。此外,它还支持通过iCloud在不同设备间同步日记,让用户随时随地都能记录和查看自己的日记。

  • Stytch Fraud & Risk Prevention:行业领先的精准欺诈和风险预防解决方案

    Stytch Fraud & Risk Prevention 提供先进的设备指纹技术,超越了传统的CAPTCHA和WAF,能有效阻止机器人、欺诈和滥用行为。它通过高度独特的指纹技术,结合标准和专有信号,保护用户隐私的同时,确保了几乎不可能被绕过的准确性。该产品通过详细的仪表板报告,提供实时可见性,监控用户的安全姿态,并通过智能CAPTCHA技术,提高用户体验。此外,Stytch还提供了多种指纹类型和智能速率限制功能,以应对各种用例。

  • Meco:将您的新闻通讯从收件箱中解放出来

    Meco是一个新闻通讯聚合器,旨在帮助用户将新闻通讯从电子邮件收件箱中移出,以减少干扰并提高阅读效率。它通过提供智能过滤器、分组、AI音频摘要、个性化推荐等功能,使用户能够更有效地管理和阅读新闻通讯。Meco支持与Gmail和Outlook同步,提供个性化的新闻摘要,并且允许用户在任何设备上阅读,包括即将推出的Android版本。

  • Zivy:专为工程和产品领导设计的AI通信管理工具。

    Zivy是一款旨在帮助工程和产品领导管理通信混乱的AI工具。它通过自动优先排序和学习来优化消息,确保用户只关注需要立即处理的内容。Zivy通过集成Slack或Gmail等账户,使用OAuth2和官方API来保护用户密码和信息安全。它还承诺遵守SOC-2和ISO27001标准,确保数据安全。Zivy的设计理念是简化工作空间,让用户能够更专注于创造和生活,而不是被通信工具所困扰。

  • Brightband:利用AI技术预测天气和气候,助力人类适应极端天气

    Brightband是一个致力于通过先进的地球系统AI技术,使天气和气候变得可预测,以帮助人类适应日益极端的天气变化。该平台通过开源基准数据集、模型和指标,鼓励全球社区共同提升天气预测的技术水平。Brightband提供给学术界、政府和公司使用的工具,旨在改善与天气和气候相关的决策,从而长期造福人类和地球。

  • SiFive:引领RISC-V革命,提供高性能计算密度

    SiFive是RISC-V架构的领导者,提供高性能、高效率的计算解决方案,适用于汽车、AI、数据中心等应用。其产品以优越的性能和效率,以及全球社区的支持,推动了RISC-V技术的发展和应用。

  • SiFive Intelligence XM Series:高效能AI计算引擎,集成多种计算单元,提供高内存带宽。

    SiFive Intelligence XM系列是SiFive推出的高效能AI计算引擎,通过集成标量、向量和矩阵引擎,为计算密集型应用提供极高的性能功耗比。该系列继续SiFive的传统,提供高效的内存带宽,并通过开源SiFive Kernel Library来加速开发时间。

今日大家都在搜的词: