微软硬刚谷歌 AI 搜索服务上线,Windows AI 助手重磅升级:Copilot 可分析网站内容、类 GPT 语音模式对话

华尔街见闻
2024.10.01 22:56
portai
我是 PortAI,我可以总结文章信息。

微软推出一系列新 Copilot 功能,其中 Copilot Vision 可解读热门网站内容,对话后数据即刻删除,不可访问付费墙和敏感内容;Copilot Daily 提供语音时事摘要,微软为此向路透、金融时报等合作出版商付费;Think Deeper 推理复杂问题,或为 OpenAI o1 模型支持;个性化功能利用用户过往互动推荐 Copilot 用法;硬刚谷歌 AI Overviews 的必应生成式搜索周二在美国上线。

本文作者:李丹

来源:硬 AI

微软本周二连出大招,个人人工智能(AI)助手 Copilot 迎来重磅升级,微软开始向所有 Windows 系统的用户推出一系列新的 Copilot 功能,包括可以理解并回应电脑屏幕问题的新工具。同时,微软网络搜索引擎必应(Bing)正式上线 AI 生成概括摘要功能,正面硬刚谷歌的同类生成式 AI 搜索功能 AI Overviews。

从美东时间 10 月 1 日周二,微软推出适用于苹果系统 iOS、谷歌安卓系统、Windows 和网页的 Copilot 新版 App,称所有这些 App 的风格都更 “独特”、更 “暖心”。微软还将聊天机器人引入 Meta 旗下社交媒体 WhatsApp,让用户通过直接消息(DM)与 Copilot 聊天,类似于在 Meta 的消息平台上使用其他机器人的体验。

Copilot Vision 解读网站内容 对话后数据即刻删除

Copilot Vision 是 Copilot 拥有的最突出功能,顾名思义,它可以看到用户在个人电脑(PC)上查看的内容,具体来说,可以查看用户使用 微软 AI 浏览器 Microsoft Edge 访问的网站。

Copilot Vision 是一种全新 Copilot Pro 专属实验性可选功能。用户可以让它分析网页上的文本和图像,并回答有关这些网页内容的用户问题,例如用户可以问,怎么做图片显示的食物,让 Copilot 提供食谱。

用户可以通过在 Edge 的地址栏中输入 “@copilot” 调出,和谷歌在安卓系统和 Chrome 浏览器中提供的搜索技术类似。但微软表示,Copilot Vision 比过去的屏幕分析功能更强大,也更注重隐私。

微软称,Copilot Vision 可以建议用户接下来要采取哪些步骤,回答用户的问题,帮助引导指向用户想要做的任何事,并协助完成任务,用户只需用自然语言与它交谈即可。比如用户想布置一个新公寓。Copilot Vision 可以帮助搜索家具,找到合适的调色板,考虑从地毯到毯子等所有选择,甚至建议如何布置用户正在看的物品。

隐私方面,微软强调,用户可以在同 Copilot Vision 对话后立即删除对话数据。该功能处理过的音频、图像或文本不会被存储或用于训练模型,至少在这个预览版本中不会。而且 Copilot Vision 能够解析的网站类型也受到限制,只能分析解读预先批准的 “热门” 网站。目前,微软阻止该功能处理付费墙内的网站收费内容和 “敏感” 内容,不过并未透露哪些属于敏感内容。

Copilot Vision 目前仅在美国上线。微软表示,该功能将尊重网站的 “对 AI 的机器可读控制”,例如禁止机器人抓取用于 AI 训练的数据的规定。但该公司尚未明确说明 Vision 将尊重哪些控制;目前有几种控制正在使用。我们已要求微软澄清。

Copilot Daily 提供语音时事摘要 微软向合作出版商付费

微软周二发布了名为 Copilot Daily 的新闻功能,为用户提供天气和时事的语音摘要。为支持该功能,微软将向出版商支付费用,购买出现在 Copilot Daily 中的内容。

亚马逊和谷歌的语音助手 Alexa 和 Google Assistant 早就在提供类似的每日简报。微软称,Copilot Daily“可以化解人们熟悉的信息过载感觉”,它 “简洁、简单且易于理解,只会从授权内容来源中提取内容”,随着使用时间推移,该功能将提供提醒和自定义选项。

微软目前仅在美国和英国上线 Copilot Daily 功能。路透社、Axel Springer、Hearst Magazines、今日美国网络和《金融时报》同微软合作,提供该功能的信息来源。微软称,计划 “很快” 增加付费出版商,并将 Copilot Daily 扩展到更多国家。

Think Deeper 推理复杂问题 或为 OpenAI o1 模型支持

与 Vision 一样,Copilot 的新功能 Think Deeper 旨在让微软的 AI 助手更加灵活。

微软表示,Think Deeper 让 Copilot 能够推理更复杂的问题,这要归功于 “推理模型”,这累模型需要更多时间进行推理,然后给出分步骤的回答。微软并未透露具体哪些推理模型,只是说用的是 “OpenAI 的最新模型,微软进行了微调”。媒体判断,应该是指 OpenAI 的 o1 模型定制版。

从本周二起,Think Deeper 向澳大利亚、加拿大、新西兰、美国和英国的 Copilot Labs 限量的用户开放。

Copilot Voice 类似 ChatGPT 高级语音模式

Copilot 的新功能是 Copilot Voice 首先在新西兰、加拿大、澳大利亚、英国和美国推出英语版本,微软添加了四种合成的声音,让用户可以从中选择交谈的 Copilot 用哪种声音。

和 OpenAI 为 ChatGPT 提供的高级语音模式 Advanced Voice Mode 一样,Copilot Voice 可以在对话过程中识别用户的语气,并做出相应的回应,用户还可以在 Copilot Voice 应答时随时插话,和与人类对话时一样。

不过,Copilot Voice 有使用时长方面的限制。微软称,Copilot Pro 的订阅用户可以获得更多的 Copilot Voice 对话时间,但具体时长是 “可变的”,视需求而定。

个性化(Personalization)利用过往互动推荐 Copilot 用法

微软表示,启用新的个性化设置后,Copilot 很快将更加符合用户的偏好。它将利用用户过去的互动和历史记录,以及与其他微软应用和服务的互动,向用户推荐使用 Copilot 的方法。这样可以帮助用户使用 Copilot 入门,“既提供了 Copilot 实用功能的便捷指南,也提供了对话开场白。”

Copilot 的个性化功能可以在 Windows 的 Copilot 设置菜单中关闭,近期不会在英国和欧盟国家推出。

必应生成式搜索周二在美国上线

今年 7 月,微软推出了必应生成式搜索的试用版,本周二,该服务正式面向所有美国用户上线。调用它的最简单方法是在 必应上搜索 “Bing generative search”。

微软称,将要推出一个选择,以便用户更轻松地触发 Bing 生成搜索以进行 “信息查询”。

必应生成式搜索被视为微软正面对战谷歌 AI 搜索的产物。华尔街见闻 5 月曾介绍谷歌当月在 2024 Google I/O 开发者大会上推出的搜索模式三大革新,其中之首就是名为 AI Overviews 的 AI 生成摘要功能,它将生成的摘要展示在搜索结果顶部。

必应生成式搜索给予多种 AI 模型汇总来自互联网的信息,生成响应搜索查询的摘要内容。比如当用户搜索查看 “什么是意大利式西部片?” 这个问题时,必应生成式搜索将显示该类型片的历史和示例的摘要,以及来源链接。

微软认为,必应生成式搜索的功用不仅限于找答案。微软称它能理解搜索查询,审查数百万个信息源,动态匹配内容,并以新的 AI 生成布局生成搜索的结果,从而更有效地满足用户查询的意图。