首页 > 业界 > 关键词  > 百度最新资讯  > 正文

AI视野:百度将发布AI互动式新搜索;OpenAI计划重磅更新;Character.AI推出AI群聊功能;谷歌人机验证已经拦不住AI

2023-10-12 15:29 · 稿源:站长之家

文头.jpg

🤖📱💼AI应用

百度将发布AI互动式新搜索

百度世界2023即将发布AI互动式新搜索,具备听、会、看的能力,通过大模型和多轮交互提供个性化搜索体验。

【AiBase提要】

🔍 百度新搜索整合语义检索技术和大语言模型,具备听、会、看能力。

🔌 百度建设AI新生态,吸引2万家开发者入驻插件平台,扩展大模型应用生态。

📈 百度营销发布AI商业引擎,以生成式AI技术重构商业产品和解决方案,促进广泛合作。

网易有道推出全球首个虚拟人口语教练Hi Echo

有道推出虚拟人口语私教Hi Echo,提供一对一专属教练,支持多轮对话和口语练习,具备纯正美式口音。

微信截图_20231012081406.png

【AiBase提要:】

📚 Hi Echo是虚拟人口语私教,提供个性化口语练习,支持多轮对话和评分。

🎙️ 学习者可以在不同对话场景和话题中练习,覆盖多个话题,持续更新。

🎙️教练具备地道美式口音,帮助学习者轻松练习口语。

Character.AI推出AI群聊功能

Character.AI是一家由前Google AI研究人员创建的初创公司,现在为其订阅者提供新的AI群聊功能,让用户可以与多个人工智能角色实时交谈。

【AiBase提要】

🤖 Character.AI是一由前Google AI研究人员创建的初创公司,受a16z支持,为订阅者提供新的AI群聊功能。

🗣️ 用户可以创建包含多个AI角色的群聊,与朋友建立社交关系、分享想法,或进行实时协作,扩展了群聊体验。

💰 这项功能首先向C.ai+订阅者提供,以获取反馈和改进,随后将对公众开放,不是免费的服务。

百度百科推出百科AI词条编辑助手

百度百科推出基于大模型技术的AI词条编辑助手,提高编辑效率和准确性,同时计划上线百科BOT-『百科同学』,以实时对话方式解答用户知识问题。

【AiBase提要:】

1. 百度百科发布了百科AI词条编辑助手,利用前沿大模型技术,自动生成精炼摘要,提升词条编辑效率和准确性,特别适用于长篇新闻报道。

2. 百度即将推出百科BOT-『百科同学』,用于实时对话,快速解答历史知识类问题,支持趣味问答和作画等功能,以加速知识的普及。

3. 这一举措将有助于更多人通过AI辅助获得和分享知识,促进知识的普及和传播。

中国移动推出“86NEXT”AI产品,将首次应用于10086

中国移动在全球合作伙伴大会上发布了名为“86NEXT”的创新AI技术产品,以大模型为代表,将首次在10086中应用,提升用户体验与满意度。

【AiBase提要】:

🔸 中国移动发布“86NEXT” AI产品,采用大模型技术,旨在提供更深入和人性化的交流体验。

🔸 该产品可与5G视频客服技术相结合,为用户带来丰富多彩的交互体验。

🔸 除了在用户体验上的提升,它还能应用于各类服务形态,为客户提供综合问题解决方案,提高客服人员的工作效率。

微软Viva平台新增AI驱动的员工技能分析功能

微软将在Microsoft Viva员工体验平台上推出新的人工智能功能「Skills」,旨在为雇主提供员工技能的全面洞察。

Insights-workbench-with-proficiency_900.png

【AiBase提要】:

📊 新功能「Skills」旨在为雇主提供员工技能的全面洞察。

🤖 利用微软图谱和LinkedIn技能图谱的综合力量,技能功能将智能地推断员工的技能概况。

📆 预计「技能」功能将在今年年底进行私人预览测试,并成为Microsoft Viva套件的一部分。

在线支付服务商Klarna推出AI图像搜索工具

瑞典在线支付和零售服务提供商Klarna推出AI图像搜索工具“Shopping Lens”,用户可通过拍照迅速找到购物商品,还推出多项增强购物体验的功能。

image.png

【AiBase提要:】

📷 Klarna发布“Shopping Lens” AI图像搜索工具,允许用户拍照寻找商品。

🎥 “Shoppable Video”扩展至欧洲市场,提供个性化视频推荐。

🛒 推出实体店内产品扫描、新的返现计划、单一登录解决方案等功能,提升用户购物体验。

📰🤖📢AI新鲜事

OpenAI计划重磅更新 应用程序开发成本可降低20倍

OpenAI计划进行重磅更新,通过增加内存存储功能,将应用程序开发成本降低约20倍,帮助开发人员构建专属ChatGPT,还将推出新的视觉开发工具。

【AiBase提要】:

- 💡 OpenAI计划推出重磅更新,以更低价格、更高效的方式帮助构建ChatGPT,将应用程序成本降低20倍左右。

- 💡 这一更新解决了合作伙伴在开发AI软件时的高昂ChatGPT模型成本问题。

- 💡 OpenAI还将推出视觉开发工具,适用于医疗、金融、电商、娱乐等领域。

图灵奖得主Hinton加入机器人初创公司Vayu Robotics获9000万美元投资

深度学习先驱Geoffrey Hinton加入初创公司Vayu Robotics,强调AI技术可控和低道德风险,获得9000万美元投资。

QQ截图20231012141347.jpg

【AiBase提要:】

🤖 Geoffrey Hinton重返机器人领域,成为Vayu Robotics顾问。

📈 初创公司Vayu Robotics获得9000万美元投资,强调AI技术可控。

👥 公司的CTO是Hinton的门徒,开发小型送货机器人,注重AI视觉技术。

微软加强Bing AI图像生成内容限制

微软削减了Bing的DALL-E3AI图像生成功能,以加强对潜在问题关键词和内容的控制。

【AiBase提要:】

🔒 微软削减了Bing的DALL-E3AI图像生成功能,以应对用户生成问题图像的问题。

📛 用户曾经能够轻松绕过关键词限制,生成具有问题内容的图像。

🛡️ 微软加强了对潜在问题关键词和内容的控制,但仍存在不完善之处。

谷歌内部员工质疑AI聊天机器人Bard的有效性和价值

谷歌内部员工对AI聊天机器人Bard的效用产生疑虑,涉及投入资源是否合理。这些质疑对于谷歌而言,正在成为一项严峻的挑战,因为它在搜索领域的主导地位受到了一系列竞争对手的挑战。

【AiBase提要:】

1️⃣ 内部员工开始怀疑Bard的有效性和功能,引发了资源投入的疑虑。

2️⃣ 谷歌不断为Bard增加新功能以应对竞争,但也面临虚假信息和危险建议的挑战。

3️⃣ 论坛讨论还涉及到道德和社会责任,引发广泛关注。

研究人员揭示GPT-4安全漏洞,使用少见语言可绕过限制

布朗大学的研究人员发现OpenAI的GPT-4存在安全漏洞,可以通过使用少见语言如祖鲁语和盖尔语绕过其限制性设置。在处理非英语语言的限制性提示时,他们取得了惊人的79%成功率,而仅使用英语的成功率不到1%。

【AiBase提要】:

1. 研究人员揭示OpenAI的GPT-4存在安全漏洞,无法有效处理非常见训练数据中的语言,尤其在处理非英语语言时成功率高。

2. 他们通过将不安全的提示翻译成低资源的自然语言,如祖鲁语,成功绕过了GPT-4的安全机制,引发有害回应。

3. 这项研究突显了对非英语语言的安全性研究的必要性,同时也引发了关于语言不平等估值和跨语言漏洞的担忧。

中兴通讯将发布支持大模型训练的最新AI服务器

中兴通讯计划推出新一代智算中心基础设施产品,包括高性能AI服务器和数据处理器,以支持大模型训练和推理。

【AiBase提要】

🔍 中兴通讯致力于满足各类AI应用场景的需求。

📈 他们已经发布面向中小型模型的G5系列服务器。

🚀 中兴通讯计划在今年内发布支持大模型训练的最新AI服务器。

🤖📈💻💡大模型动态

OPPO推出基于AndesGPT大模型的小布1.0公测版

OPPO宣布启动AndesGPT大模型的新小布1.0公测,通过4位量化技术,在不降低精度的情况下实现性能优化,并将在ColorOS14发布会上公布更多相关信息。

知识与百科能力国内第一!ColorOS  14 将搭载新小布: 11 月 16 见

【AiBase提要:】

📌 OPPO推出小布1.0公测,基于AndesGPT大模型,通过4位量化技术提高性能。

📌 AndesGPT大模型是OPPO的生成式大语言模型,在知识与百科能力测试中表现出色。

📌 用户可以报名参与小布1.0公测,更多信息将在ColorOS14发布会上披露。

智源研究院开源中英双语大模型悟道·天鹰340亿Aquila2-34B

智源研究院发布了悟道·天鹰340亿(Aquila2-34B)模型,在推理、泛化、代码生成等方面表现卓越,同时还提供开源项目,推动大模型研究的协同创新。

微信截图_20231012133913.png

【AiBase提要:】

悟道·天鹰340亿(Aquila2-34B)模型在综合能力方面超越其他开源基座模型,领先于同级别的对话模型。

智源研究院还发布了多个开源项目,包括 FlagScale 高效并行训练框架和 FlagAttention 高性能 Attention 算子集,以进一步推动大模型研究的发展。

该模型在推理能力和处理长文本任务方面表现出色,提供了强大的自然语言处理能力。

Aquila2模型全系开源地址:

https://github.com/FlagAI-Open/Aquila2

https://model.baai.ac.cn/

https://huggingface.co/BAAI

Kandinsky1:3.3亿参数强大模型,文本生成逼真图像

Kandinsky1是一款强大的文本到图像生成模型,拥有3.3亿参数,通过潜在扩散技术实现高质量图像生成,在COCO-30K验证数据集上获得8.03的FID分数。

image.png

【AiBase提要:】

🌟 Kandinsky1拥有3.3亿参数,表现卓越,通过潜在扩散技术实现高质量文本到图像生成。

🖼️ 基于扩散的模型标志着文本到图像生成的演进,超越了传统GANs的性能。

📊 Kandinsky在COCO-30K数据集上取得8.03的FID分数,与最先进的文本到图像生成模型竞争激烈。

👨‍💻💡🎯聚焦开发者

谷歌人机验证已经拦不住AI了

苹果AI/ML团队与哥伦比亚大学合作研发的多模态大模型“雪貂”(Ferret)成功突破了谷歌人机验证码,可准确识别交通信号灯位置,性能媲美GPT-4V。

image.png

【AiBase提要】:

1. Ferret是由苹果AI/ML团队与哥伦比亚大学合作研发的多模态大模型,在“看说答”任务中表现出色,准确识别交通信号灯。

2. Ferret创新之处在于将引用和定位的空间理解能力紧密结合,同时理解语义和找到目标。

3. 这一模型采用混合区域表示方法,结合离散坐标和连续特征,在多任务评估中表现出色,为图像理解和多模态任务提供新的方向。

项目地址:https://github.com/apple/ml-ferret

论文地址:https://arxiv.org/pdf/2310.07704.pdf

Docker发布全新AI堆栈

Docker在Dockercon23大会上推出全新Docker GenAI堆栈,使生成式AI应用程序的开发变得更加容易,降低容器配置复杂性,提供免费的部署和商业支持选项,推动AI技术的普及和发展。

AiBase提要:

🚀 Docker发布全新Docker GenAI堆栈,推动AI应用程序的开发革命。

🧩 Docker GenAI堆栈简化生成式AI应用程序的开发,整合了Neo4j图形数据库和LangChain模型链技术。

💰 Docker GenAI堆栈是免费提供的,为开发人员提供本地运行选项,提高开发人员的体验。

LLM-Shearing大模型剪枝法:用5%的成本拿下SOTA

陈丹琦团队开发了LLM-Shearing大模型剪枝法,可将大型预训练模型剪枝至低成本,同时保持高性能水平,比重新预训练更经济。

image.png

【AiBase提要:】

1. LLM-Shearing是一种大模型剪枝方法,将预训练模型剪枝至仅需3%的计算量和5%的成本,同时保持高性能。

2. 剪枝方法将模型剪枝看作一种约束优化问题,同时学习剪枝掩码矩阵以最大化性能为目标。

3. 这项研究提供了一种高效的方式,可用于将剪枝后的模型继续预训练,最终超越从头开始预训练的模型。

论文地址:

https://arxiv.org/abs/2310.06694

Hugging Face:

https://huggingface.co/princeton-nlp

项目主页:

https://xiamengzhou.github.io/sheared-llama/

Replit将GhostWriter融入核心平台 全面开源AI开发工具

Replit宣布将GhostWriter AI代码补全工具融入其核心平台,全面开源,使所有用户能够享受人工智能增强的编程体验。

image.png

【AiBase提要:】

👉 Replit整合GhostWriter,向所有用户提供AI代码补全工具。

👉 公布开源大语言模型 replit-code-v1.5-3b,旨在赋能全球开发者。

👉 Replit使用自家构建的开源技术,包括更新版本的大语言模型,支持多种编程语言,并在强大硬件上训练。

革命性视频合成工具MAGVIT-v2将视觉内容转化为大模型的标记

卡内基梅隆大学、Google研究和乔治亚理工学院联合推出的MAGVIT-v2视频标记工具,将图像和视频转化为大型语言模型可理解的标记,为视觉生成任务带来重大突破。

image.png

项目地址:https://magvit.cs.cmu.edu/

【AiBase提要】:

1. MAGVIT-v2是一项视频标记工具,由卡内基梅隆大学、Google研究和乔治亚理工学院联合开发,能将图像和视频输入转化为大型语言模型可识别的标记。

2. 这一革命性工具的独特算法使开发者能够实现各种令人惊叹的应用,从全景视频到智能去除和图像转动动画。

3. MAGVIT-v2在视觉生成任务中明显超越传统扩散模型,为大型语言模型在视觉任务领域带来崭新机遇。

FAVOR:通过精细融合音频和视觉细节提升大模型视频理解能力

研究人员最近发布了名为FAVOR的创新技术,它能够通过精细融合音频和视觉信息,显著提高大型语言模型对视频内容的理解能力,为人工智能视频理解技术的进步带来积极影响。

【AiBase提要】:

1. FAVOR技术巧妙地融合音频和视觉信息,从帧级别提升大型语言模型对视频的理解。

2. 这一创新为大型语言模型在视频理解领域开辟新机遇,提高了视频理解的准确性和效率。

3. FAVOR支持多模态输入,包括文本、图像、音频和视频,为用户提供更精确的多媒体交互体验。

举报

  • 相关推荐
  • 大家在看
  • 万彩商图:快速更换商品图片背景,提升商品展示效果。

    万彩商图是一个在线设计工具,专注于帮助用户快速更换商品图片的背景,以提升商品的视觉效果和吸引力。它利用AI技术实现一键式操作,简化了传统图片编辑的复杂流程,使非专业用户也能轻松制作出专业的商品展示图。

  • AIEmoji:快速找到适合你情感的Emoji表情。

    AIEmoji是一个基于人工智能技术的Emoji搜索网站,它允许用户通过自然语言描述来搜索和找到匹配的Emoji表情。这项技术简化了Emoji的搜索过程,提高了用户在社交、写作和其他需要表情符号的场合的效率和表达能力。

  • Brev.ai:AI音乐生成器,几秒钟创作高质量音乐。

    Brev.ai是一款利用人工智能技术,根据用户输入的文本描述快速生成独特音乐作品的在线音乐创作工具。它基于Suno V3.5技术,支持多种音乐风格和流派,适用于视频、播客、游戏配乐等多场景。Brev.ai的主要优点包括高效率、成本效益高、易于使用,以及能够提供高质量的音乐输出。

  • 知了zKnown:致力于信息降噪 / 阅读提效的个人知识助手

    知了 zKnown 是一款 AI-Native 构建的个人知识助手,专注于信息降噪和阅读提效。它通过多端同步、多渠道总结、长文本支持等功能,帮助用户高效地管理和整理信息。产品的主要优点包括:- 多端同步:用户可以在移动app、桌面客户端、网页版、小程序等多个平台同步使用。- 多渠道总结:支持微信公众号、知乎、简书、36Kr、少数派等多个渠道的文章总结。- 长文本支持:最长支持总结3万字的文章内容。- 摘要导出:用户可以将摘要保存到 Notion、Flomo 等平台。- 产品背景:知了 zKnown 致力于通过 AI 技术提升用户的阅读和信息管理效率,适合需要高效处理大量信息的用户。

  • MBox AI Meet:实时转录与会议总结的谷歌会议扩展

    MBox AI Meet是一款免费Chrome扩展,专为Google Meet设计,提供实时转录和自动生成会议总结的功能。它利用AI技术帮助用户在会议中专注于讨论,而无需担心记笔记。该工具通过实时转录捕捉会议的每一个细节,并在会议结束后自动生成总结,确保用户不会错过任何重要信息。MBox AI Meet的隐私优先策略确保会议安全,不存储任何音频或视频内容。此外,该扩展还计划在未来更新中增加更多AI功能,如发言人识别、实时AI助手等。

  • Klee:本地安全AI,保障数据隐私。

    Klee是一款macOS原生的AI助手应用程序,专注于本地处理数据,确保数据安全和隐私。它使用先进的AI技术,如RAG(检索增强生成)和开源大型语言模型,如Llama 3和Mistral,为用户提供高效、智能的笔记、搜索和知识管理功能。Klee的主要优点包括本地运行以保护隐私、支持团队协作、免费使用以及优化的macOS体验。

  • Kipps.AI:快速构建AI助手,提升业务效率

    Kipps.AI 是一个在线平台,允许用户在短短两分钟内构建自己的AI助手,并将其集成到业务中。该平台支持多种数据源,如PDF、Notion、网站链接和文本,用户只需提供这些数据,Kipps.AI 会处理其余部分。它还与常用的工具如GoDaddy、Wordpress、Drupal、Squarespace、Magento和Wix等进行集成,使得用户可以轻松地将AI助手集成到现有的业务流程中。

  • CrossPrism for MacOS:图像识别、标注和关键词生成工具

    CrossPrism for MacOS 是一款专为摄影师设计的图像识别、标注和关键词生成工具。它利用多核 CPU、GPU 和神经引擎,能够识别物种、生成标题和描述,并支持模型训练的可定制性。用户可以在本地自动标注无限量的原始照片,确保所有照片安全地存储在 Mac 上,无需担心云服务中断、数据锁定或文件传输问题。其20多个专家模型可以对从鸟类到地标的各种内容进行分类,并提供新的视角来整理目录和重新发现旧照片。此外,它还支持视频处理、Lightroom 插件、图像质量评估等功能,使其成为一个强大的筛选工具。

  • ZETIC.ai:构建零成本的设备端AI。

    ZETIC.ai提供了一种革命性的设备端AI解决方案,使用NPU技术帮助企业减少对GPU服务器和AI云服务的依赖,从而显著降低成本。它支持任何操作系统、任何处理器和任何目标设备,确保AI模型在转换过程中不损失任何核心功能,同时实现最优性能和最大能效。此外,它还增强了数据安全性,因为数据在设备内部处理,避免了外部泄露的风险。

  • Kerqu.Ai:一站式AI内容生成器,助力跨境电商提升效率。

    Kerqu.Ai是一个为跨境电商卖家提供一站式AI解决方案的平台,整合了先进的AI技术,帮助用户节约成本、提升品牌影响力和销售转化率。产品通过AI技术实现模特换场景、AI图片创作、批量抠图、图片变高清等功能,同时提供一键撰写文案、优化文案和多语言翻译服务,满足多站点经营需求。

  • ReviewHawk:通过分析用户评论,降低用户流失率。

    ReviewHawk是一个专注于分析应用商店评论的工具,旨在帮助企业降低用户流失率,获取用户反馈,从而改善产品。它通过数据驱动的决策和用户满意度分析,帮助企业了解用户真正想要的功能,从而提升用户留存率和产品满意度。

  • Airtable Cobuilder:快速创建与管理数据的应用程序

    Airtable Cobuilder 是一款强大的应用程序构建工具,旨在通过简单的拖放界面和AI辅助功能,帮助用户快速创建和管理数据。它允许用户连接和简化他们最关键的数据,通过可视化数据、自定义视图和集成其他业务工具,提高团队协作和数据管理的效率。该工具特别适合需要高度定制化和灵活性的业务应用场景。

  • Alertfor:追踪网络信息,及时获取答案变化

    Alertfor 是一个在线平台,通过其专有的AQTA (Ask Question Track Answer) 流程,允许用户提交复杂问题,并在网页上寻找最相关的答案。它通过持续追踪提供连续的更新,确保用户能够获得准确且及时的信息。

  • Unskool:家长支持工具,助力家庭教育

    Unskool是一个由家长为家长制作的辅助工具,旨在简化家庭教育过程。它通过去除繁琐的行政工作,让家长能够专注于创造一个丰富的学习环境,让家长和孩子都能茁壮成长。Unskool提供了跟踪、记录和灵感激发的功能,并通过人工智能生成定制的、按需的课程计划,帮助家长更高效地进行家庭教育。

  • AI Generated Diagram:智能生成图表工具

    AI Generated Diagram 是一款利用人工智能技术生成图表的工具。它通过用户输入的提示(prompts)来创建图表,支持多种布局类型,如水平布局(Horizontal)。用户可以通过编辑、配置等操作来调整图表的细节,并支持导出为SVG格式或导出数据。该工具不仅提高了设计图表的效率,还通过AI技术提升了图表的美观度和准确性。

  • Free AI Image Extender:使用人工智能扩展图像边界

    AI Image Extender 是一款利用人工智能技术扩展图像边界的工具,通过生成新内容与现有图像无缝融合,增强图像的视觉延展性。该产品通过先进的AI算法,能够智能识别图像内容并生成自然过渡的扩展区域,适用于需要图像扩展或背景生成的各种场景。

  • Capacities:一个为你的思维打造工作室的APP

    Capacities是一个旨在改善人们思考方式和工作流程的应用程序。它通过使用对象而非传统文件和文件夹来组织信息,帮助用户更直观地理解和连接复杂的信息结构。该应用支持网络化笔记,使用户能够自然地构建信息网络,激发新的创意。Capacities还提供AI助手,帮助用户与笔记中的对象动态互动,并提高写作质量。此外,该应用注重数据安全和隐私保护,符合GDPR标准,数据存储在欧盟的加密服务器上。

  • CLASI:高质量、类人同声传译系统

    CLASI是一个由字节跳动研究团队开发的高质量、类人同声传译系统。它通过新颖的数据驱动读写策略平衡翻译质量和延迟,采用多模态检索模块来增强特定领域术语的翻译,利用大型语言模型(LLMs)生成容错翻译,考虑输入音频、历史上下文和检索信息。在真实世界场景中,CLASI在中英和英中翻译方向上分别达到了81.3%和78.0%的有效信息比例(VIP),远超其他系统。

  • image-matting:AI抠图项目,使用开源模型实现图像抠图。

    image-matting 是一个基于开源模型 briaai/RMBG-1.4 的AI抠图项目。该项目旨在通过学习AI技术、GUI开发、前端学习以及i18n国际化等技术,实现本地模型算法的图像抠图功能。它支持单张和批量抠图,用户可以通过拖拽和粘贴的方式快速进行图像处理。项目还提供了打包后的运行文件下载链接,方便用户使用。

  • OnlyPans:AI定制周晚餐计划

    OnlyPans是一个利用人工智能技术为用户提供定制化晚餐计划的应用程序。它通过与用户的简短聊天来了解用户的预算、口味偏好、语言习惯、饮食限制以及日常生活的忙碌程度,然后快速生成符合用户需求的晚餐计划。随着用户使用时间的增长,OnlyPans会不断学习和优化,提供更加个性化的服务。此外,OnlyPans还提供智能购物清单功能,帮助用户避免食品浪费和不必要的紧急购物。OnlyPans注重用户隐私保护,承诺不会出售用户的任何信息。

今日大家都在搜的词: