facebook开始使用人工智能向盲人用户描述照片

问问Facebook成长团队的一位成员，哪项功能在让公司每天拥有10亿用户方面发挥了最大的作用，他们很可能会告诉你这是照片。自从2005年Facebook推出一年后，用户就可以上传源源不断的图片，这使得这个社交网络在全球受众中无法抗拒。很难想象没有照片的Facebook。然而，对于数以百万计的盲人和视障人士来说，这已经是十多年来的现实。...

不再是了。今天，Facebook将开始自动向盲人和视障用户描述照片内容。名为“自动替代文本”的功能是由Facebook成立5年的无障碍团队创建的。在Facebook产品组前用户研究员杰夫·维兰德（Jeff Wieland）的带领下，该团队此前为视频建立了闭路字幕，并实施了一个选项，在Facebook iOS上增加默认字体大小，10%的Facebook用户利用了这一功能。

用画外音大声朗读照片的描述

自动alt-text现在出现在iOS上，后来出现在Android和web上，它使用机器学习识别照片中的对象。机器学习通过使用算法进行预测来帮助建立人工智能。例如，如果你给一个软件显示足够多的狗的图片，它就能及时地在照片中识别出狗。自动alt文本识别Facebook照片中的内容，然后使用iPhone的画外音功能将照片的描述大声读给用户听。虽然这项技术还处于早期阶段，但它可以可靠地识别交通（“汽车”、“船”、“飞机”）、自然（“雪”、“海洋”、“日落”）、体育（“篮球场”）和食品（“寿司”）等类别中的概念。这项技术还可以描述人（“婴儿”、“微笑”、“胡须”），并识别一张**。

上周，我去了位于门罗公园的Facebook无障碍实验室，看看这项技术的实际应用。Wieland和一位失明的Facebook工程师mattking也在场。金出生时视力有限，大学时失明，自上世纪80年代以来，他一直提倡使用更方便的电脑。今天，他在一个万维网联盟中代表Facebook，负责制定网页访问的技术规范。

盲人上网的主要方式是通过屏幕阅读器——一种描述屏幕上显示的元素（一个链接、一个按钮、一些文本等等）并使其能够与之交互的软件。网络经过多年的发展，对盲人更加友好。例如，你在每个Facebook帖子上看到的向下三角形，允许你隐藏帖子或将其报告为垃圾邮件，被屏幕阅读器描述为“故事选项，折叠弹出按钮”，而不是一个三角形。这样，盲人用户就知道他们可以与之互动。

大部分的网络对于盲人来说是遥不可及的

但大部分的网络长期以来都是盲人无法接触到的。”“你以前经常听到文件名，你不知道它们是否可以点击，”金说那是一场盛大的复活节彩蛋狩猎，一点也不好玩。甚至当我发现这些蛋的时候，很多蛋都是照片。人们用图片交谈，而用图片交谈对我来说本来就是遥不可及的“我们不想增加很多摩擦，”金说当人们上传一张照片时，我们可能会要求他们：“请为盲人描述一下这张照片。”这会让人发疯——这永远不会在规模上奏效。”（这是Twitter解决这个问题的实际方法，尽管添加描述是可选的。）

Facebook的规模是巨大的：每天，用户通过Facebook、Instagram、Messenger和WhatsApp上传20亿张照片。因此，无障碍团队求助于Facebook的人工智能部门，该部门正在开发自动识别图像的软件。”金说：“如果看不到照片、看不懂照片内容的人能够成为社区的一部分，从这个平台上获得与能看到照片的人一样的享受和利益，我们就需要解决这个问题。”。

在一次演示中，金在Facebook上调出了一些包含照片的故事。他把屏幕设为黑色，所以我们什么也看不见。如果你想重新思考你所知道的关于网页设计的一切，看一个盲人上网五分钟。通常情况下，King会让屏幕阅读器以难以置信的速度与他交谈——现在，最轻微的音频提示会让他在页面上定位，大声阅读Facebook上的帖子，识别链接，并显示各种按钮。当他在标准的macbookair上输入命令时，手指模糊了。直到金再次打开屏幕，我才完全不知所措，只留下了几句描述我们在Facebook上看到的内容的话。

在Facebook上有一张照片的标题是“周日晚上挥霍”，电话里大声念出来的描述是“比萨饼，食物”。当金再次打开屏幕时，有一张巨大的意大利香肠比萨饼和橄榄的照片。另一张照片的标题是“庆祝活动”，**将这张照片描述为“三个人在户外微笑”，结果是……三个人在户外微笑“现在我真正理解了这个故事的本质，”金说有时候一个词能做的事情真的很神奇。”

Facebook并不是唯一一家使用机器学习来理解照片的公司；这是目前人工智能在任何复杂程度上都能做到的几件事之一。类似的技术支持谷歌照片和Flickr的关键词搜索。但是这项技术仍然容易出错，数百万个对象还没有被解析。去年，谷歌因照片将两名黑人标记为“大猩猩”而被迫道歉

默认情况下，如果Facebook有80%的信心知道自己在看什么，它只会为照片建议一个标签。但该公司告诉我，在敏感案件中，包括涉及种族的案件，在提出建议之前，需要有更高水平的信心。当Facebook不自信的时候，它根本不会给出一个描述。”在某些情况下，没有数据比坏数据更好。

“在某些情况下，没有数据总比坏数据好。”

这是老生常谈é 对于科技公司来说，把一个项目描述为“刚刚开始”，但在这种情况下，感觉尤其真实。今天它只能在一个平台上工作，而且只能用英语。Facebook仍有数百万个对象无法以80%的置信度识别披萨“它知道。”但是研究小组已经在努力开发两种新工具：识别视频中的物体，这项技术在11月份首次演示；它还称之为“视觉问答”，这将允许用户就图片提问，并从Facebook的人工智能中得到答案。例如，你可能会问照片中的人是谁，它会告诉你出现在照片中的Facebook好友的名字。

在这个阶段，自动alt标签代表了一个迷人的技术演示。但从规模上看，它们也可能代表一个增长机会——残疾人平均不太可能使用Facebook，原因显而易见。”“包容是非常强大的，排斥是非常痛苦的，”金说这样做的影响就是告诉盲人，你参与全世界的社会对话的能力对我们来说非常重要。这是说作为一个人，你很重要，我们关心你。我们想把所有人都包括进来——我们会尽一切努力把所有人都包括进来。”

发表于 2021-05-04 02:58
阅读 ( 141 )
分类：互联网

你可能感兴趣的文章

您现在可以使用facebook messenger发送4k照片

Facebook正在推出一项针对智能**摄影师的新功能。它描述了我们99%的人。Facebook将Messenger支持的最大分辨率从2K提高到4K，这意味着你现在可以发送和接收全分辨率的照片，而无需Messenger压缩它们。 ...

发布于 2021-03-12 08:50
阅读 ( 170 )

instagram现在可以向视障用户描述照片

Instagram增加了两项新功能，旨在让视障人士更容易使用Instagram。这些功能意味着屏幕阅读器将能够准确描述上传到Instagram的照片中的内容。 ...

发布于 2021-03-22 14:04
阅读 ( 177 )

facebook改进了针对视障用户的人工智能图像描述

Facebook对其用于帮助盲人和视障人士识别平台上图像的人工智能模型进行了重大改进。这个人工智能工具的更新使得它在提供图像的准确描述方面更加可靠。 ...

发布于 2021-03-28 02:11
阅读 ( 172 )

facebook的下一个大型人工智能项目是在用户的公共视频上训练机器

教人工智能系统尽可能完整地理解视频中发生的事情是机器学习领域最困难的挑战之一，也是最大的潜在突破。今天，Facebook宣布了一项新的举措，希望能让它在这项重要的工作中占据优势：在Facebook用户的公共视频上训练人工...

发布于 2021-04-16 02:30
阅读 ( 238 )

微软新的图像标题人工智能将有助于在word、outlook和其他应用程序中实现易访问性

...，这种算法在某些有限的测试中超过了人类的精确度。该人工智能系统已被用于更新该公司为视障人士开发的助手应用程序Seeing AI，并将很快被整合到其他微软产品中，如Word、Outlook和PowerPoint。在那里，它将用于创建图像的alt文...

发布于 2021-04-17 14:17
阅读 ( 187 )

facebook的新人工智能工具将自动识别你出售的物品

...cebook正在推出一种所谓的“通用产品识别模型”，它利用人工智能识别消费品，从家具到快速时尚再到快速汽车。这是迈向未来的第一步，在未来的网站上，每一张图片上的产品都可以被识别，并有可能被购买。Faceb...

发布于 2021-04-19 12:56
阅读 ( 272 )

盲人旅行者旧金山机场测试信标系统

...人设计的。 位置信标在采用方面还处于初级阶段，但开始出现在零售场所、博物馆、电影院和一些体育场馆。梅西百货、美国鹰百货和洛德百货等零售商；泰勒和比利时安特卫普的鲁本之家博物馆（Ruben's House museum）正在测...

发布于 2021-04-27 00:21
阅读 ( 163 )

看一个神经网络描述它在阿姆斯特丹漫步时所看到的

...描述图片来帮助盲人。  像这样的系统有时被称为人工智能，但这是在夸大事实。虽然描述图像和视频看起来确实很聪明，但相关程序对图像中的内容没有真正的了解。他们只是刚刚能够认识到物体之间的关系（你用来描...

发布于 2021-05-02 13:40
阅读 ( 98 )

facebook正在分发它用来理解照片中物体的软件

...，可以识别照片中物体的种类和形状。这些工具由Facebook人工智能研究（FAIR）团队开发，被称为DeepMask、SharpMask和MultiPathNet，这三种工具协同工作，帮助分解图像的内容并将其上下文化。这些技术虽然目前还没有在Facebook消费类...

发布于 2021-05-07 04:02
阅读 ( 151 )

苹果正试图利用人工智能将iphone变成dslr

...增强图像信号处理器（ISP）。市场总监PhilSchiller说，这个人工智能驱动的ISP在25毫秒内完成了多达1000亿次的操作。这需要一些解包和解惑，我们应该从苹果用来宣传iPhone事件的图片开始。邀请函上写着“7日见”，并用一种流行...

发布于 2021-05-07 12:34
阅读 ( 174 )

facebook开始使用人工智能向盲人用户描述照片

你可能感兴趣的文章

相关推荐