【南方都市报】AI辅具能让我们更有尊严地老去吗?“中国版霍金”这样说
- 文章来源:
无障碍智库
- 发布时间:2020.11.04
10月22日,由中国计算机学会(CCF)主办的2020年中国计算机大会在北京开幕。
当天一大早,CCF杰出会员、中国科学院心理研究所副研究员王甦菁就开着他的代步车,风风火火地赶到了现场。今年,他组织了一场主题为“人工智能+辅具”的专题技术论坛。辅具,指的是可以帮助老年人、伤病人、残障人士补偿身体功能障碍的器具,比如拐杖、轮椅等。这是中国计算机大会举办十三年来,罕见的以无障碍技术为主题的技术论坛。论坛的来源与王甦菁的日常息息相关:被媒体称为“中国版霍金”的他,出生时就不幸脑瘫,衣食住行都离不开辅具,最了解残障人士对辅具的需求与期望。2012年实施的《无障碍环境建设条例》曾提出,国家鼓励、支持采用无障碍通用设计的技术和产品,推进残疾人专用的无障碍技术和产品的开发、应用和推广。
更重要的是,中国的人口老龄化程度正在不断加深,可能在2022年左右正式进入老龄社会。老去的过程势必伴随身体功能的退化甚至丧失,未来,对辅具有需求的老年人也会越来越多。有感于社会的变化,王甦菁特意邀请了多位人工智能与辅具领域的专家,在论坛上展开探讨。清华大学计算机系副研究员喻纯和浙江大学教授、中国残疾人信息和无障碍技术研究中心副主任卜佳俊,分别从软硬件的角度切入,介绍了他们研发的助盲技术。有数据显示,中国的视障人群数量超过1700万。网络购物、追剧、看新闻等普通人习以为常的事,对盲人而言却困难重重。以验证码输入为例,许多读屏软件只能识别网页上的文本,无法识别验证码图片上的内容,这使得盲人在账号登录环节就被卡住。
清华大学计算机系副研究员喻纯介绍了一种智能交互代理系统,能帮助盲人更好地使用手机应用。喻纯解释说,读屏软件对第三方应用信息的读取,依赖于应用开发者的配合——为应用内的各个模块添加相应的标签和文本标注。但是当前的第三方应用参差不齐,应用内的前后景控件和层级不分,也缺乏标注。此外,现在的应用内都会有大量图片,读屏软件很难读取到图片内的信息。“谈到智能交互,我们有几个目标。第一个是信息获取不能有障碍,应用界面上所有的控件层级、交互语义信息都能识别。第二个是交互方便,表达自然,支持语音、手势等新的输入方式。”喻纯说,智能交互代理系统已基本实现了这些目标,而且盲人用户只要安装相应的App、贴上辅助“屏保膜”就可以,不用对原有的手机和应用进行过多改造。在现实生活中,很多盲人需要双手操作手机:一只手拿手机,一只手摸屏幕。但盲人外出时往往还需要一只手来拿盲杖或牵引导盲犬,这样的操作显然很不方便。喻纯与团队还开发了一种基于电容屏图像分析的“耳朵识别”智能算法,让盲人可以用耳朵在手机上执行按压、触摸浏览等操作。盲人想自如的生活,还少不了外力的帮助。浙江大学教授、中国残疾人信息和无障碍技术研究中心副主任卜佳俊介绍,目前的助盲技术系统主要有三类,第一类是传统导盲技术系统,比如盲杖;第二类是侵入式的视觉辅助技术,比如通过脑机接口为盲人加装“仿生眼”;第三类是非侵入式视觉辅助系统技术,比如超声波导盲眼镜或头箍。
在卜佳俊看来,第一类技术系统使用场景有限、无法充分满足盲人需求,第二类技术系统所使用的技术尚未完全成熟,具有较高的风险和成本。相较而言,第三类是更加方便、现实、安全的选择。因此,从2019年开始,他带领团队投入了智能助盲眼镜的研发。经过一年多的研发,智能助盲眼镜已基本成型,集成障碍物检测、交通标志检测、人脸识别、文本识别、语音交互等一系列针对盲人生活“痛点”的功能。以交通标志检测为例,智能助盲眼镜能够识别与盲人出行关系最为密切的20种交通标志,包括斑马线、无障碍坡道、交通信号灯,等等。卜佳俊介绍,为了解决交通标志尺度变化大、背景复杂导致的检测识别准确率低、速度慢等问题,团队研发了一种基于深度学习的新算法。值得注意的是,智能助盲眼镜还加入了熟人识别、表情识别等人脸识别功能。如果迎面而来的是亲友,眼镜就会像佩戴者发出提醒,并且提示对方的表情。卜佳俊说,从实验来看,熟人识别和表情识别的精度分别能达到99.7%和85%。研发完成后,团队招募了15名盲人志愿者进行试用。卜佳俊说,志愿者者的总体反馈还不错。“用户提出的反馈意见与建议,也为产品的迭代和后续研发提供了很好的参考方向。”他说,产品研发完成后不断扩大用户体验规模,在功能优化的同时,还可以提供更多的能力去服务各类残疾人。除了帮助残障人士解决生活困难的智能辅具,也有一种类型是帮助健全人更顺畅地与残障人士交流。中国科学技术大学信息学院教授周文罡介绍了视频手语识别的研究。他们希望让机器学会看手语,当聋哑人士对着摄像头比手语时,机器可以同步地将手语识别出来,并转为口语化的表达。为了达到这个目标,周文罡首先要让机器学看手语词,但这并不容易。在中国,常用手语词大概有5600个,这些词可以组合出非常复杂的句子。此外,手语跟方言有相似性,不同地区、不同个体的手语习惯不一样;手语视频往往存在两手之间互相遮挡、背景干扰等问题,这些都对机器识别造成了挑战。就此,周文罡提出,可以利用手的先验模型,生成手部的3D骨架数据,再通过推理模型识别手语词。“比如说,尽管人眼看到的是个二维的手型,但是你可以推测出对应三维的手长什么样子。”在团队的测试中,手语识别效果已经有了不错的改善。北京保益互动科技发展有限公司创始人曹军则以盲人的身份,针对无障碍技术设计提出了一些建议。曹军回忆,有一次,他在某个机场试用无障碍电梯,却发现电梯的盲文在很低的位置,他需要蹲下来才能摸到。从他的亲身体验看,像这样为残障人士设计、但实际上并不好用的产品还有很多。曹军说,这些产品的设计初衷都是好的,但开发者对用户需求的想象和判断,不一定符合残障人士的真实需要,用户用起来不一定方便。在现实中,开发者往往在产品成型后才邀请残障人士参与测试,“这个时候就晚了 ”。“你们要做产品的,一定要跟我们交朋友,先了解了我们的需求,再去设计产品,这样的产品一定会被社会所认可,一定能够真正改变残障人士的生活方式。”
“人工智能加辅具的研究,给我们的无障碍建设带来了更好的机遇。”在圆桌环节,中国残联副主席吕世明说道。他表示,产学研各方关注残障人士的需求和愿望是非常好的事,“就怕大家不关注、不研究”。但正如曹军说的一样,研究者有必要将用户体验环节前置,在研发初始阶段就践行“无障碍设计”理念,找准用户需求,避免走弯路。“以前有一个说法是,发达国家在关注20%的(弱势)人群,发展中国家在关注80%的人群。为什么我们现在说国家强大了,其实我能感觉到,国家的关注点正在从80%的人群向20%的人群转移,越来越关心残疾人、老年人等一些特殊人群。”中国残疾人信息和无障碍技术研究中心主任助理王炜说,“人工智能、大数据等前沿技术,可能会在特殊人群的帮助上发挥更大的作用。”曹军也表达了类似的观点。他举例说,随着时代的变化,盲人也借助辅具用上了智能手机、电脑。他相信,技术的发展会进一步改善残障人士的生活水平。“或许5年以后,我们就能借助科技的力量看到这个社会了。”