丁道师：扒一扒搜狗和腾讯刀剑相向的往事

2013-09-17 11:01 · 稿源：丁道师博客

《丁道师：扒一扒搜狗和腾讯刀剑相向的往事》文章已经归档，不再展示相关内容，编辑建议你查看最新于此相关的内容：杭州互联网法院与腾讯京东搜狗达成涉网纠纷调解合作杭州互联网法院与腾讯京东搜狗达成涉网纠纷调解合作 11 月 16 日，在上海举办的“第三届新兴法律服务产业博览会

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐腾讯阿里，有点像抖音拼多多了

AT两巨头在同日发布了今年一季度财报。腾讯和阿里的营收都是个位数增长，腾讯营收同比增长6%至1595.01亿元，阿里营收同比增长7%至2218.74亿元。”腾讯和阿里都给出了积极的未来业绩指引，但成果究竟如何要看两家的战略执行力度。

腾讯阿里财报
腾讯和字节的幽灵在中国AI的上空徘徊

2023年4月，产品经理松鹅从腾讯离职两天后，就从深圳来到北京，加入一家基座大模型的初创公司。这家公司还没什么资本追捧和用户声量，只有一个听起来挺拗口的中文名字：月之暗面。从做产品的方法，到所谓的产品哲学，再到产品与技术的关系，这些决定着中国AI未来走向的问题，某种程度都在延续着腾讯和字节在移动互联网的故事，这两个幽灵会继续游荡在中国AI的上�

产品经理创业公司 AI项目
腾讯会议发布腾讯天籁inside3.0，为厂商提供AI音视频算法解决方案

AI时代，会议室的良好拾音和区分说话人技术，是实现语音转文字、字幕翻译和智能纪要等能力的前提。4月17日，腾讯会议天籁实验室发布腾讯天籁inside3.0升级，在腾讯AILab多项技术加持下，推出16mic多模态人像分割解决方案，具备智能音幕功能，能够精准区分和定位会议室里的发言人，并升级了去混响效果。腾讯会议已经广泛服务金融、互联网、教育、医药、工业制造等行业，包括中国人民银行、清华大学、国家电网、中国交建、中国银行、美的、卫龙、国泰君安证券、北京朝阳医院等众多企事业单位，在多个行业的头部客户渗透率超过50%。

语音转文字智能纪要人像分割
人死后聊天记录会被怎样处理专家：所有权归腾讯公司所有

快科技5月10日消息，微博话题人死后聊天记录会被怎样处理”冲上了热搜榜第二名。据国内多家媒体报道，很多人会担心自己死后，QQ和微信里面的聊天记录会被别人看到，就赶紧去清理聊天记录。对此，专家指出，QQ号的所有权属于腾讯，QQ的使用权限也仅仅限制于初始注册人”，如果腾讯发现你的账号初始注册不是你，就有权在未经允许的情况下终止对你的服务。专家进一�

聊天记录隐私互联网遗产网络供应商权利
以前谈恋爱要交换QQ密码引热议腾讯回应

快科技5月7日消息，近日，话题#曾经的恋爱需要交换QQ密码#在热搜中引发热议。网友调侃：死去的回忆突然发动攻击”少轻狂时交换过的QQ密码是我们最珍贵的电子戒指。”对此，腾讯QQ安全中心做出回应：虽然很荣幸曾在大家的青春岁月中担任爱情守护者”，但是保护QQ密码的重要性不容忽视，一些高风险的行为必须避免！腾讯提醒用户：完全公开自己的QQ密码，可能本意是表

QQ密码安全网络安全腾讯QQ
腾讯内容开放平台发布公告打击“AI洗稿”行为

腾讯内容开放平台在北京发布公告，针对个别MCN及作者发布大量违规“AI洗稿”内容的现象，宣布将采取严厉措施，保障平台正常内容生态及原创作者权益。平台巡查发现违规行为严重影响了内容生态的健康发展。腾讯内容开放平台的这一举措受到了广泛关注，业界普遍认为，这对于整个内容创作生态都具有积极的促进作用，也将为内容行业的发展提供更加清朗的环境和规范。

腾讯内容开放平台 MCN AI洗稿
腾讯张军回应微信撤回有提示：保障送达准确性

4月28日，对于众多网友普遍关注的一个疑问——“为何微信消息撤回后仍会显示‘xx撤回了一条消息’的提示”，腾讯的张军先生给出了明确回应，他坦言:“这个问题确实存在。”他进一步解释道，通信的首要原则便是确保信息的准确送达。这样的设计旨在让双方都能对通信状态有一个清晰的了解，避免因信息的不确定性引发的误解或混淆。
腾讯SaaS产品智能化升级全面接入混元模型

腾讯宣布旗下协作SaaS产品全面接入混元模型，实现软件服务智能化。腾讯乐享、腾讯电子签、腾讯问卷等产品已实现智能化升级，为用户提供更智能、高效的服务。在企业内部学习和培训场景中，腾讯乐享利用大模型能力提升知识传递效率;在电子合同场景下，腾讯电子签通过大模型和AI能力提升合同起草、审阅效率，智能筛查合同风险;在问卷调研场景中，腾讯问卷提供全流程

腾讯 SaaS 混元模型
腾讯公布五一假期未成年人限玩日历

腾讯游戏已正式发布了关于2024年劳动节假期未成年人游戏限玩时间的通知，为切实保护未成年人的身心健康，防止其沉迷网络游戏，特制定以下限玩日历。根据《关于进一步严格管理切实防止未成年人沉迷网络游戏的通知》精神，结合2024年劳动节假期的实际调休安排，中国大陆地区运营的腾讯网络游戏将对未成年人实施以下限玩措施:在以下特定时间段内，未成年人可以登录游戏，享受短暂的娱乐时光:4月26日至27日，每日的20时至21时;5月1日至5日，每日的20时至21时;5月10日，20时至21时;5月12日，20时至21时。腾讯游戏呼吁广大家长和社会各界共同关注未成年人的健康成长，合理安排他们的学习和娱乐时间，共同营造一个健康、和谐的网络环境。
微信消息撤回仍有提示、没有已读功能：腾讯正式回应

快科技4月28日消息，对于众多网友关心的“微信消息撤回，为什么还会有提示xx撤回了一条消息？”的问题，腾讯公关总监张军今天进行了回应。

微信腾讯

MuLan:：为110多种语言适配多语言扩散模型

MuLan是一个开源的多语言扩散模型，旨在为超过110种语言提供无需额外训练即可使用的扩散模型支持。该模型通过适配技术，使得原本需要大量训练数据和计算资源的扩散模型能够快速适应新的语言环境，极大地扩展了扩散模型的应用范围和语言多样性。MuLan的主要优点包括对多种语言的支持、优化的内存使用、以及通过技术报告和代码模型的发布，为研究人员和开发者提供了丰富的资源。

多语言图像生成扩散模型

MiLM-6B:小米开发的大规模预训练语言模型，参数规模64亿。

MiLM-6B是由小米公司开发的大规模预训练语言模型，参数规模达到64亿，它在中文基础模型评测数据集C-Eval和CMMLU上均取得同尺寸最好的效果。该模型代表了自然语言处理领域的最新进展，具有强大的语言理解和生成能力，可以广泛应用于文本生成、机器翻译、问答系统等多种场景。

自然语言处理机器学习人工智能

TalentGenius:AI驱动的职业管理平台，优化你的职业路径，匹配最佳工作机会。

TalentGenius是一个利用人工智能技术帮助专业人士评估技能、优化职业路径，并匹配最佳工作机会的平台。它通过AI工具提供个性化的职业导航、辅导、招聘和咨询，帮助用户在技术快速发展的今天保持竞争力。

AI职业管理技能评估工作匹配

Pipecat:开源框架，用于构建语音和多模态对话AI。

Pipecat是一个开源框架，用于构建语音和多模态对话代理，如个人教练、会议助手、儿童故事玩具、客户支持机器人、接待流程和机智的社交伴侣。它支持本地运行，并可迁移到云端，集成了多种AI服务和传输方式，具有高度的可定制性和扩展性。

实时 AI 语音

MetaTrend:每日五分钟，掌握AI、加密货币和金融行业动态

MetaTrend是一个专注于提供AI、加密货币和金融行业趋势的新闻网站。它通过每日更新的新闻摘要，帮助用户快速了解这些领域的最新动态，对于希望紧跟科技和金融潮流的专业人士来说，这是一个不可或缺的工具。

新闻摘要行业趋势金融分析

打标助手:一个批量给图片进行文字标注的免费工具，专为模型训练提供标注数据。

打标助手是基于GPT4-Vision开发的一个在线工具，它通过微调prompt实现批量图片文字标注，为基于SD模型的训练提供数据支持。该工具的主要优点在于其免费性、批量处理能力和高效的标注准确性，特别适合需要大量图片标注的科研和商业用户。

AI标注批量处理数据安全

Gemma 2:谷歌下一代Gemma模型，提供突破性的性能和效率。

Gemma 2是下一代谷歌Gemma模型，拥有27亿参数，提供与Llama 3 70B相当的性能，但模型大小仅为其一半。它在NVIDIA的GPU上运行优化，或在Vertex AI上的单个TPU主机上高效运行，降低了部署成本，使更广泛的用户能够访问和使用。Gemma 2还提供了强大的调优工具链，支持云解决方案和社区工具，如Google Cloud和Axolotl，以及与Hugging Face和NVIDIA TensorRT-LLM的无缝合作伙伴集成。

AI 机器学习深度学习

Gemini 1.5 Flash:Google 一款轻量级、高效能的AI模型，专为大规模高频任务设计。

Gemini 1.5 Flash是Google DeepMind团队推出的最新AI模型，它通过'蒸馏'过程从更大的1.5 Pro模型中提炼出核心知识和技能，以更小、更高效的模型形式提供服务。该模型在多模态推理、长文本处理、聊天应用、图像和视频字幕生成、长文档和表格数据提取等方面表现出色。它的重要性在于为需要低延迟和低成本服务的应用提供了解决方案，同时保持了高质量的输出。

AI 机器学习多模态

Imagen 3:谷歌高质量文本到图像模型，生成逼真、生活化图像。

Imagen 3 是谷歌一个先进的文本到图像的生成模型，它能够生成具有极高细节水平和逼真效果的图像，并且相较于之前的模型，其视觉干扰元素显著减少。该模型对自然语言的理解更为深入，能够更好地把握提示背后的意图，并从更长的提示中提取细节。此外，Imagen 3 在渲染文本方面表现出色，为个性化生日信息、演示文稿标题幻灯片等提供了新的可能性。

AI图像生成文本到图像创意工具

Veo:Google最先进的视频生成模型，提供高质量1080p视频生成。

Veo是Google最新推出的视频生成模型，能够生成高质量的1080p分辨率视频，支持多种电影和视觉风格。它通过先进的自然语言和视觉语义理解，能够精确捕捉用户创意愿景，生成与提示语调一致且细节丰富的视频内容。Veo模型提供前所未有的创意控制水平，理解电影术语如“延时摄影”或“航拍景观”，创造出连贯一致的画面，使人物、动物和物体在镜头中逼真地移动。

AI 视频生成创意工具

PaliGemma:Google的尖端开放视觉语言模型

PaliGemma是Google发布的一款先进的视觉语言模型，它结合了图像编码器SigLIP和文本解码器Gemma-2B，能够理解图像和文本，并通过联合训练实现图像和文本的交互理解。该模型专为特定的下游任务设计，如图像描述、视觉问答、分割等，是研究和开发领域的重要工具。

视觉语言模型图像理解文本生成

lluminous:一个快速、轻量级的开源聊天界面。

lluminous是一个快速、轻量级的开源聊天界面，支持多供应商API密钥，提供完整的隐私保护，所有对话历史和密钥都存储在本地。它支持多模态输入、多轮对话提示、预填充响应、模型切换以及对话分享等功能。

开源聊天界面多供应商支持

CuMo:一种用于扩展多模态大型语言模型（LLMs）的先进架构。

CuMo是一种多模态大型语言模型（LLMs）的扩展架构，它通过在视觉编码器和MLP连接器中融入稀疏的Top-K门控专家混合（MoE）块，提高了模型的可扩展性，同时在推理时几乎不增加激活参数。CuMo在预训练MLP块后，初始化MoE块中的每个专家，并在视觉指令调整阶段使用辅助损失以确保专家的均衡负载。CuMo在各种VQA和视觉指令遵循基准测试中超越了其他同类模型，且完全基于开源数据集进行训练。

AI 多模态学习大型语言模型

混元-DiT:高性能细粒度中文理解模型，提供双语生成能力，专注于中国元素理解。

混元-DiT是腾讯推出的首个中英双语DiT架构的人工智能模型，专注于中文元素理解，具备长文本理解能力和细粒度语义理解。该模型能够分析和理解长篇文本中的信息，并生成相应的艺术作品，包括但不限于人物写真、创意创作等。混元-DiT的推出，对于提升中文文本理解的深度和广度，以及促进中英双语交流具有重要意义。

人工智能文本理解艺术创作

GPT-4o:，一款能够实时处理音频、视觉和文本的旗舰模型。

GPT-4o（'o'代表'omni'）是自然人机交互的重要一步，它可以接受任意组合的文本、音频、图像和视频输入，并生成任意组合的文本、音频和图像输出。它在音频输入响应上的速度极快，平均响应时间仅为320毫秒，与人类对话的响应时间相近。在非英语文本处理上取得了显著进步，同时在API上速度更快且成本降低了50%。GPT-4o在视觉和音频理解方面也比现有模型更出色。

人工智能自然语言处理机器学习

AutoGroq:AI驱动的对话助手，自动生成专家代理，简化AI工具交互。

AutoGroq是一个AI驱动的对话助手，旨在通过自动生成专家代理来彻底改变用户与AI工具的互动方式。它克服了现有解决方案的局限性，提供了一个用户友好、强大且无需配置的体验。该平台专注于通过自动生成专门针对任何问题的专家代理，无论问题的复杂性如何，提供即时和相关的帮助。

AI 对话助手自动化

OpenGlass:记录生活，获取有用的总结和建议，为任何用例定制眼镜

OpenGlass是一款可穿戴眼镜，它能够记录用户的生活，并提供有帮助的总结和建议。这款眼镜可以针对不同的使用场景进行定制，适合追求个性化体验和生活记录的用户。它结合了最新的硬件技术和软件开发，为用户带来全新的交互体验。

可穿戴设备生活记录智能建议

Refuel LLM-2:专为数据标注、清洗和丰富设计的先进语言模型

Refuel LLM-2 是一款为数据标注、清洗和丰富而设计的先进语言模型。它在约30种数据标注任务的基准测试中超越了所有现有的最先进语言模型，包括GPT-4-Turbo、Claude-3-Opus和Gemini-1.5-Pro。Refuel LLM-2 旨在提高数据团队的工作效率，减少在数据清洗、规范化、标注等前期工作上的手动劳动，从而更快地实现数据的商业价值。

数据标注语言模型自动化

Llama3-Aloe-8B-Alpha:Aloe是一款专为医疗领域设计的高性能语言模型，提供先进的文本生成和对话能力。

Aloe是由HPAI开发的一款医疗领域的语言模型，基于Meta Llama 3 8B模型进行优化。它通过模型融合和先进的提示策略，达到了与其规模相匹配的最先进水平。Aloe在伦理和事实性指标上得分较高，这得益于红队和对齐工作的结合。该模型提供了医疗特定的风险评估，以促进这些系统的安全使用和部署。

医疗语言模型文本生成

FunClip:开源、精准、方便的视频切片工具

FunClip是一款完全开源、本地部署的自动化视频剪辑工具，通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别，随后用户可以自由选择识别结果中的文本片段或说话人，点击裁剪按钮即可获取对应片段的视频。FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large，是当前识别效果最优的开源中文ASR模型之一，并且能够一体化的准确预测时间戳。

丁道师：扒一扒搜狗和腾讯刀剑相向的往事

今日大家都在搜的词：

热文

站长商机