首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

AI视野:ChatGPT用户可以访问互联网了;Photoshop网页版正式推出;微调多模态大模型会灾难性遗忘

2023-09-28 15:01 · 稿源:站长之家

文头.jpg

📰🤖📢AI新鲜事

ChatGPT用户可以访问互联网了!

OpenAI 宣布 ChatGPT 用户现在可以浏览互联网,不再受限于2021年9月之前的数据。这一更新允许用户访问最新信息,拓展了 ChatGPT 的应用领域。

🚀 AiBase提要:

1. 💡 ChatGPT现在支持浏览互联网,不再受限于2021年9月前的数据。

2. 💡 这一更新扩大了ChatGPT的功能,用户可以访问最新信息和链接。

3. 💡 OpenAI计划将这一功能扩展给所有用户,提供更广泛的数据范围。

Adobe Photoshop网页版正式推出

Adobe正式推出了Photoshop网页版,包含Firefly AI生成式填充等功能,用户界面简化,但暂无免费版本计划。

image.png

AIBase提要:

🔶 Photoshop网页版正式推出,含AI功能

🔷 用户界面简化,适合新用户

🔶 暂无计划推出免费版本

微软在Windows11画图软件中测试由DALL-E驱动的文字转图像工具

微软宣布在Windows11自带的画图软件Paint中测试一个由DALL-E驱动的文字转图像创作工具PaintCocreator,用户可以通过输入文本描述来生成艺术创作图像。PaintCocreator允许用户输入文本描述后自动生成相关图像,也可以选择艺术风格后生成3个图像样例供用户选择。当前以预览版面向Windows Insider用户推出,未来可能会对所有Windows11用户开放。

image.png

AiBase提要:

1. 微软在Windows11的Paint中测试DALL-E驱动的文字转图像工具,允许用户通过文本描述生成艺术图像。

2. PaintCocreator可自动生成相关图像,提供艺术风格选择和图像编辑功能。

3. 目前为预览版,仅面向Windows Insider用户,未来可能收费或对所有Windows11用户开放。

决策类AI公司第四范式在港交所上市

决策类人工智能公司第四范式在香港联合交易所主板挂牌上市,发行价55.60港元,开盘价上涨13.49%。

AiBase提要:

📈 发行价上涨:决策类AI公司第四范式在香港联合交易所主板挂牌上市,每股价格55.60港元,开盘价上涨13.49%。

💼 财务表现:招股书显示,第四范式2020-2022年营收逐年增长,2023年第一季度营收为6.44亿港元。

🤖 AI转型计划:第四范式是中国最大的决策类AI公司,计划利用募集资金加强基础研究、技术能力和解决方案开发,扩展产品和进入新行业领域。

京东云发布言犀 AI 计算平台,助力大模型落地

京东云在西安城市大会上发布了言犀 AI 计算平台,通过优化算力和存储,帮助大模型开发者降低门槛和成本。

AiBase提要:

1、平台提供全流程的数据准备、模型开发、训练和部署能力,支持无代码开发,让大模型应用开发更加简单。

2、言犀平台内置了优秀商业模型和开源模型,还提供应用场景的专有模型,帮助产业公司快速落地大模型。

3、通过言犀平台,大模型向各行各业的落地将变得更加快速和高效。

扎克伯格预测:明年将迎来人工智能名人与粉丝互动时代

Meta首席执行官马克·扎克伯格表示,人工智能名人与粉丝互动可能在明年成为现实。他提到了粉丝与名人互动的需求,但也指出了品牌安全的考虑,可能会推迟到明年才成为主流。

🤖 AiBase提要:

📣 马克·扎克伯格预测:明年人工智能名人将与粉丝互动。

🤩 粉丝与名人的互动需求巨大,但品牌安全也是考虑因素。

💡 技术挑战和品牌安全问题需要解决,新时代或将到来。

👨‍💻💡🎯聚焦开发者

智源研究院开源 AI 硬件评测引擎FlagPerf v1.0

FlagPerf v1.0是由智源研究院发布的开源AI硬件评测引擎,评测包括功能正确性、性能、资源使用和生态适配等指标。该项目已涵盖多领域模型,支持多框架和测试环境,确保评测公平并开源测试代码。

AiBase提要:

📊 功能评测:验证芯片支持模型运行

🚀 性能评测:评估训练时间和计算吞吐量

💾 资源使用:衡量芯片和服务器其他零部件的使用情况

修复视频新神器BSCV工具集 为视频修复技术开辟新可能

在过去十年中,视频修复技术取得了显著进展,但对于常见问题如直播视频的修复效果不尽理想。为了更好地应对这些问题,研究人员开发了BSCV数据集,一个专为解决视频修复问题而设计的全新工具和视频集合。

image.png

论文地址:https://arxiv.org/pdf/2309.13890v1.pdf

AiBase提要:

1. 📊 数据集介绍: BSCV数据集包含超过28,000个视频剪辑,用于模拟真实世界的比特流损坏视频恢复,具有多种复杂和不可预测的错误模式。

2. 🛠️ 损坏模型创新: 研究人员提出了一个三参数损坏模型,模拟视频比特流的损坏,增加数据集的挑战性和现实性。

3. 🖼️ 视频恢复框架: 论文介绍了一种视频恢复框架,包括插件式特征增强模块,用于提取和融合受损和无损区域的局部特征,以提高视频恢复性能。这一框架灵活且适用于多种比特流相关的视频恢复任务。

多模态大模型KOSMOS-2.5擅长处理文本密集图像

KOSMOS-2.5是一款多模态模型,专注于处理文本密集图像,采用了统一的Transformer框架,具备卓越的文本图像理解能力。

image.png

论文地址:https://arxiv.org/abs/2309.11419

AiBase提要:

1️⃣ KOSMOS-2.5基于Transformer框架,支持端到端文本图像理解,包含视觉编码器和文本解码器,可生成Markdown格式文本。

2️⃣ 预训练使用大规模数据集,达到3.24亿条,增强多模态理解力。

3️⃣ KOSMOS-2.5在文档文本识别、Markdown生成等任务上表现卓越,具备潜力应用于更广泛领域。

马毅团队新研究:微调多模态大模型会灾难性遗忘

随着GPT-4的发布,多模态大模型(MLLM)成为热点。业界常将视觉编码器与语言模型集成构建MLLM。尽管微调后的MLLM在视觉语言任务上表现强劲,但仍面临灾难性遗忘的问题,即过拟合微调数据集后,在其他任务上的性能下降。

image.png

论文地址:https://arxiv.org/pdf/2309.10313.pdf

AiBase提要:

1. 马毅团队提出了EMT框架,评估微调后的多模态大模型(MLLM)的灾难性遗忘。

2. 实验表明,微调MLLM在提升微调数据集性能的同时,也导致其他数据集性能下降。

3. 微调过程中,MLLM会产生与微调数据集相关的幻觉文本,忽略原始问题。

Vizro:一个创建模块化数据可视化应用的工具包

Vizro是一款强大的工具包,无需深入编程或设计经验,可快速自助组装自定义仪表板,使用Python创建灵活可扩展的数据可视化应用。

image.png

项目地址:https://github.com/mckinsey/vizro

AiBase提要:

📦 快速自助组装仪表板: Vizro让您以分钟级速度创建自定义仪表板,无需编程经验。

🔧 简单配置代码: 只需几行配置代码,即可创建复杂仪表板,内置Plotly和Dash等库。

🧩 模块化扩展: 可选高代码扩展功能,结合低代码和高代码优点,创建可扩展Python数据可视化应用。

OpenLM:一个专为中等规模语言模型设计的模型训练库

OpenLM是一个PyTorch代码库,旨在训练中等规模语言模型,通过训练OpenLM-1B和OpenLM-7B两个语言模型,分别在1.6T和1.25T文本标记上进行验证,取得了出色的成果,包括在零样本文本分类和多项选择任务上的表现。

image.png

AiBase提要:

🚀设计重点:OpenLM旨在最大化GPU利用率和训练速度,适用于新的语言模型研究和应用。

🧠模型验证:OpenLM-1B和OpenLM-7B在1.6T和1.25T文本标记上进行验证,在零样本文本分类和多项选择任务上表现卓越。

🌟未来展望:OpenLM计划支持多模态模型、专家混合和数据集组合,以及扩大规模以支持更大的语言模型。

🤖📱💼AI应用

百度推出求职助手类AI机器人 提供面试指导、薪资谈判等服务

百度搜索推出了一款求职助手类的AI机器人,旨在帮助求职人群提升求职体验,包括简历优化、面试指导、薪资谈判等全流程服务。该机器人可以根据用户的情况提供个性化的职业推荐和谈薪话术,帮助求职者更好地准备面试并获得满意的薪资待遇。此举是为了帮助应届生和职场新人在竞争激烈的秋招季中脱颖而出,轻松拿到心仪的offer。

微信截图_20230928082244.png

AiBase提要:

🤖 AI求职助手登场: 百度推出了一款AI机器人,旨在提升求职人群的求职体验。

📄 全流程服务: 该机器人涵盖简历优化、面试指导和薪资谈判等全方位服务,个性化推荐职业和谈薪话术。

🎯 助力应届生: 主要目标是帮助应届生和新职场人员在竞争激烈的秋招季中脱颖而出,轻松获得心仪的职位。

Meta 推出新的人工智能工具和名人代言的数字助手

Meta推出新的人工智能工具和名人代言的数字助手,CEO马克·扎克伯格希望这些工具可以帮助启动元宇宙。

AiBase提要:

🚀 数字助手与智能眼镜: Meta在开发者大会上展示了AI软件、新款虚拟现实头戴设备,以及智能眼镜。

📱 聊天应用整合AI: 用户可以在Facebook旗下应用中分享通过AI技术生成的数字贴纸,如滑稽卡通风格的数字贴纸。

🌐 合作与元宇宙愿景: Meta与名人合作,打造数字代言人,计划让用户创建自己的数字助手,以推动元宇宙构建。

Instagram 即将推出生成式 AI 图像编辑功能

Instagram将推出名为“restyle”的图片编辑工具,用户可以通过文字描述改变图片的外观。此外,还将推出名为“backdrop”的工具,可以为图片添加生成式AI生成的背景。Meta公司还展示了基于AI的贴纸功能,允许用户通过文本提示快速为聊天和故事创建自定义贴纸。

image.png

📷 AiBase提要:

Instagram将推出名为“restyle”的图片编辑工具,通过文字描述改变外观。

新工具“backdrop”可为图片添加生成式AI生成的背景。

基于AI的贴纸功能允许用户为聊天和故事创建自定义贴纸。

🤖📈💻💡大模型动态

法国初创公司 Mistral AI 免费发布高性能语言模型 Mistral7B

Mistral AI,一家法国人工智能初创公司,最近发布了一款性能优越的语言模型 Mistral7B,并免费向所有人提供使用。该模型性能出色,免费下载无限制。

AiBase提要:

🔍 Mistral7B模型免费发布

🚀 高性能语言模型

💡 提供多种下载方式

举报

  • 相关推荐
  • 大家在看
  • Suinfy:AI-powered YouTube视频摘要器

    Suinfy是一个AI-powered YouTube视频摘要器,提取长视频中的关键思想和见解。节省您的时间,提高您的生产力。

  • Amplifiles:转化PDF为动态体验

    Amplifiles可以将PDF转化为动态体验,为销售和营销专业人员提供AI语音解说、自定义CTA、CRM集成等功能,提升销售效果。详细定价和功能列表请访问官网了解。

  • ImageAI.QA:100%免费AI图片描述生成器

    AI图片描述生成器是一个能够使用人工智能自动生成图片描述的工具。它可以帮助艺术家、设计师等创作者揭示他们作品背后的隐藏细节、情感和含义。该工具提供全新的视角,让人们可以更深入地理解和欣赏艺术作品。AI图片描述生成器是一个早期测试版本,部分功能可能还不稳定。如果您在使用过程中遇到任何问题或有任何建议,请随时与我们联系。您的反馈对我们非常重要,将帮助我们改进该工具。

  • SpeedProof:快速修改、检查语法、翻译、解释、总结

    SpeedProof: One-Click AI Text Edit是一个一键式的AI文本编辑插件,可以快速修改、检查语法、翻译、解释和总结所选文本。只需选中文本,点击SpeedProof插件图标,选择所需操作即可使用ChatGPT进行修改。支持检查语法、总结、翻译、重新表达等功能,可在任何语气下进行操作。

  • AI Detector:检测AI生成的内容

    AI Detector是一个在线工具,使用先进的算法和机器学习来检测文本是否由AI生成。它可以分析写作风格和句子结构,判断内容是否由ChatGPT、GPT 4、Bard、Claude或人类创作。您可以免费使用AI Detector,每次最多检测1000个字,并获得95%的准确率。

  • WitChat:AI支持的最佳客户服务系统

    WitChat是一款具有AI集成的客户服务系统。我们的软件通过文本、手机、电话、电子邮件、聊天和社交媒体等多种渠道增强客户互动体验。

  • editoReview.com:基于AI的论文和应用界面的同行评审

    editoReview是一个为学术编辑和营销代理提供咨询服务的平台,旨在评估研究文章或服务插件API在AI界面上的可搜索性和可用性。用户可以通过AI聊天记录或模板文档开始新的评审,引用参考文献或应用程序以与作者或开发者安排会议,支付咨询费用,并发布可共享的评审记录。editoReview通过智能搜索和智能使用的方式帮助编辑和营销人员明确论文或服务插件在界面上的可行性,并在arXiv文献和Zapier市场的其他论文和应用上进行了整合。

  • Draph Art:AI生成的背景去除和高质量产品图片

    Draph Art是一款能够自动生成背景去除、道具、光照、阴影和模特等所有元素的AI产品。无需专业技术,任何人都可以制作出吸引人的产品图片。通过Draph Art,您可以使用相关的产品照片来吸引顾客的注意力。从一张原始照片到多种主题的产品照片,只需告诉我们您想要的主题,AI将分析上传照片的背景氛围和颜色,然后为所选择的主题生成多张照片。

  • 百度文库-智能漫画·智能画本:一站式智能漫画创作工具,从创意到作品一键实现

    百度文库推出的智能漫画创作工具,具有以下优势:1.一站式创作流程,从创意到成品无缝衔接。2.多种漫画风格可选,如韩系卡通、浪漫厚涂等。3.人物形象、表情、场景等描绘精细生动,媲美漫画家水准。4.内置智能编辑器,可对细节进行精修。5.无需专业绘画技能,有创意即可创作。6.目前处于公测阶段,可关注公众号预约体验。

  • 星辰语义大模型-TeleChat:星辰语义大模型,智能对话助手

    TeleChat是由中电信人工智能科技有限公司研发的星辰语义大模型,具备强大的对话生成能力,支持多轮对话,适用于多种场景的智能问答和内容生成。模型经过大量高质量中英文语料训练,具备优秀的通用问答、知识类、代码类、数学类问答能力。

  • Live2D Virtual Human for Chatting based on Unity:基于Unity的Live2D虚拟人实时聊天系统

    AI女友是一款基于Unity开发的Live2D虚拟人实时聊天系统,它利用Live2D技术提供动态的虚拟人形象,结合Unity的实时渲染功能,实现与用户的动态交互和聊天。主要功能包括Live2D虚拟人形象集成、实时聊天、图像处理和人脸检测,支持高清分辨率显示,并且可自定义和扩展。

  • School AI:个性化AI学习助手,提升学习效率

    School AI是一个专为K12学生设计的AI平台,提供个性化学习体验和即时反馈,支持多语言环境,帮助学生以母语进行互动,增强教育的普遍性和包容性。平台对教师免费开放,内置监控和控制工具,帮助教育工作者设计更好、更个性化的课堂体验。

  • MetaAI:使用 Meta AI 助手完成任务、创建免费 AI 生成图像和获取任何问题的答案

    Meta AI 是一款功能强大的 AI 助理,建立在 Meta 的先进 AI 技术之上。它可以帮助您完成各种任务,如创建备忘单、润色电子邮件写作、回答问题等。同时它还具有图像生成功能,可以根据您的文字描述生成相应的图像。Meta AI 免费使用,致力于为用户提供高效、智能、多功能的 AI 体验。

  • Meta Llama 3:Meta 新一代开源大型语言模型,性能卓越

    Meta Llama 3是Meta公司推出的新一代开源大型语言模型,性能卓越,在多项行业基准测试中表现出色。它可支持广泛的使用场景,包括改善推理能力等新功能。该模型将在未来支持多语种、多模态,提供更长的上下文窗口和整体性能提升。Llama 3秉承开放理念,将被部署在主要云服务、托管和硬件平台上,供开发者和社区使用。

  • HuggingChat App:连接先进AI与用户的革命性平台

    HuggingChat是一款iOS应用程序,旨在促进用户与多家提供商(如Mistral AI、Meta和Google)的多个顶尖大型语言模型之间的无缝沟通。它可以满足多种场景需求:激发创意,提供专家指导,促进教育与自我提升,提高工作效率,快速响应日常问题等。作为变革性AI技术的先锋采用者,HuggingChat将让您体验与先进大语言模型对话的无限可能。

  • SpeedLegal:个人AI合同谈判助手

    SpeedLegal是一个利用机器学习技术(特别是深度学习、大型语言模型和通用AI)来突出合同中的条款和关键风险的技术初创公司。我们分析您的文档并发送给您一个简化的报告,以便您在签名前做出更明智的决策。

  • FCK.School:AI写作工具

    FCK.School是一个为学生提供AI写作工具的在线平台。它可以帮助学生改善写作技巧,提升学术表现。通过FCK.School的AI驱动工具,学生可以进行文本改写、文摘、语法纠错等操作,还能生成各种写作素材,如标题、论点、大纲等。FCK.School提供免费工具以供试用,同时还有付费订阅计划。

  • CompliantChatGPT:AI医疗助手,HIPAA合规

    CompliantChatGPT是一款专为医疗保健行业设计的AI助手,它通过HIPAA合规的方式,帮助医疗工作者安全、高效地处理医疗相关任务。产品具备以下特点: - 保护患者数据安全,通过令牌化技术确保个人健康信息(PHI)的安全。 - 提供个性化的医疗模式,包括血液分析、PHI匿名化、诊断和治疗规划等。 - 用户友好的界面设计,支持语音到文本的笔记功能,便于记录和回顾。 - 定价策略灵活,提供免费试用,以及多种付费套餐选择。 - 适用于医疗提供者、专业人士、医疗机构、研究中心和健康科技初创企业。

  • Healax:AI驱动的心理健康解决方案

    Healax是一款创新的AI驱动的心理健康解决方案,专为学生设计,帮助他们主动应对日常生活中的压力和焦虑。该产品通过建立学生、行政人员和提供者之间的信任沟通渠道,提供定制化活动和内容,以促进更全面的教育体验。

  • Snowflake Arctic Embed:开源的先进文本嵌入模型

    Snowflake Arctic Embed是一系列基于Apache 2.0许可开源的文本嵌入模型,专为检索用例设计。这些模型在Massive Text Embedding Benchmark (MTEB)检索基准测试中提供了领先的检索性能,为组织在结合专有数据集与大型语言模型(LLMs)进行检索增强生成(RAG)或语义搜索服务时提供了新的优势。这些模型的尺寸从超小型(xs)到大型(l),具有不同的上下文窗口和参数数量,以满足不同企业的延迟、成本和检索性能需求。

今日大家都在搜的词: