

用 AI 为语言障碍者制作声音 小米招募语音捐赠者
中国有 3000 万的听力障碍和表达障碍者,他们想要「说话」往往需要借助手语或辅助工具完成,那么一个从来没说过话的人,他的声音会是什么样子呢?
小米正在为从来没说过话的用户,定制一个「属于」他自己的声音。
打开链接观看:
http://mpvideo.qpic.cn/0bc37iaaqaaaumaoffd4vvrfb6wdbd5aacaa.f10002.mp4?dis_k=2591fd9167aa36e7c45aac1d573b6e3b&dis_t=1652680810&vid=wxv_2395138075816558593&format_id=10002&support_redirect=0&mmversion=false
要完成这样的声音定制,除了需要声音匹配算法来为受捐人找到匹配的捐赠人,以及超级拟人技术使合成音色更加自然外,还需要很多复杂的因素。像是声音捐赠人的隐私、新音色与捐赠人音色的差异性、受捐人使用范围的限定等等。而其中最不可或缺的,就是一个丰富的声音捐赠库。当这个声音捐赠库越丰富,受捐人就能找到与其声音条件越接近的「胚子」。
为了建立声音捐赠库,小米邀请大家成为声音捐赠志愿者,当你的声音条件与言语障碍者匹配,小米将邀请你来进行进一步捐赠录音,为受捐人制作属于他的声音。
消息来源:MIUI
谷歌新款 AR 眼镜 给世界加上了字幕
2022 年度谷歌 I/O 开发者大会上,演示了一段长度不到 2 分钟的视频,介绍了一个似乎正在进行中的谷歌 AR 眼镜项目。
视频的主角是一对母女,母亲只会说普通话,而女儿说的是英文。为了帮助平常沟通不便的她们,谷歌团队为她们提供了一款 AR 眼镜。视频中,母亲戴上眼镜后,可以将女儿说的话实时记录,翻译成更熟悉的中文,并以近似字幕的方式加载在视野中。
这不是谷歌第一款智能眼镜产品。但与九年前发布 Google Glasses 相比,客观来说,今天演示的功能更加实用,也更有人文关怀。作为对比,当年发布谷歌眼镜时,演示的对象是极限运动爱好者,这也显示出谷歌对于产品定位的变化。
「语言是彼此联系的基础。然而,理解说不同语言的人,或者如果你是听力障碍者,试图跟上对话可能是一个真正的挑战,」谷歌工程师表示,「让我们看看我们在翻译和转录方面取得的进步,并在将我们的早期原型产品之一,交付到用户的视线中时会发生什么。」
考虑到除了翻译之外,谷歌在地图、搜索、AI 等领域也有大量技术和数据的积累,这让谷歌 AR 眼镜的未来更加值得期待。谷歌的工程师很自豪的说:「做到即时且直观地获取信息,技术本身就不易被察觉了,这让我们与周围的人和事物更好地建立连接。」赋予人们与任何人沟通的天赋,不管他们说什么语言,这是一件非常酷的事情。
消息来源:极客公园
这款眼镜能帮视障用户听到世界
荷兰公司 Envision 基于 Google Glass 打造了一款可「读屏」现实世界的智能眼镜 Envision Glasses。
这款眼镜搭载了一枚 8 百万像素的摄像头,用来扫描物体表面。
然后,人工智能负责从图像中批量提取印刷文字、手写笔记等不同类型的信息,再转化为语音反馈给视障用户,并且支持使用 60 多种不同的语言。
值得指出的是,这个设备还具有颜色检测、光线检测、物体识别和面部识别等功能。因此,它可以像语音助手一样给用户详细地描述当前所「看」的场景,实现「听到你想去看的」。
从实时文本识别到视频通话,它能在多种生活场景中为视障用户带来帮助。
比如,视障人士可以更快地从白色衣服中挑出红色的袜子、知道空间里的灯是否还开着、寻找个人物件、快速辨别出同事、在购物时与朋友视频通话咨询建议。
消息来源:爱范儿
《包容性设计原则手册》为开发者提供无障碍设计指导
微软中国、小米集团以及上海有人公益基金会联合发布中文版《包容性设计原则手册》,这是科技企业首次在中国发布以包容性为主题的设计手册,旨在通过全面的知识体系为企业和开发者在策略制定和产品研发设计过程中,提供无障碍指导,从而为残障人士和身处各类障碍情境中的人们提供便利。手册中阐释了包容性设计原则,包括识别排斥、从多样中学习、使更广泛的人群受益。
包容性设计是一种能够充分利用并实现人类多样性的设计方法,旨在开发出在身体、认知和情感上适用于每一个人的产品,并通过无障碍产品、服务、环境以及体验来降低各类群体参与社会的准入门槛。
消息来源:微软科技
《中国公益组织互联网使用与传播能力第八次调研报告》发布
关注技术公益发展的 NGO2.0,发布了《中国公益组织互联网使用与传播能力第八次调研报告》,该报告旨在评估并推动中国公益组织的互联网使用与传播能力,为公益行业数字化能力建设提供参考和借鉴。
公益组织的数字化需求面临投入不足等问题。公益组织的数字化需明确且逐年增长,但对应的预算投入非常低,能提供技术支持的人员并不充分,说明整个行业缺乏资金层面上的有力支持。我们呼吁更多的基金会和资源方,从行业基础设施的层面,支持公益组织的数字化和技术需求。
公益组织的互联网传播策略培训需求没有得到满足。从 2009 年至今,公益组织的互联网传播策略培训需求持续旺盛,但又有相当多的组织很少或从未接受过相关培训,说明这类需求始终没有得到有效回应,这可能会无形中拉大组织间的差距。我们相信,传播数字化会成为公益数字化的重要突破机会。
公益组织的数字化能力在提高但也引发数据联通问题。疫情以来,使用项目管理、在线会议、文档协作、联系人管理、传播和筹款等互联网工具的组织不断增加,这显著提升了组织效率和行业效能;但混合使用多种工具,也容易形成组织内部的数据孤岛。再次呼吁更多技术公司继续开放产品能力和运营能力,加强对公益组织的支持力度。
公益组织间的能力差异可能会加剧行业马太效应。根据调研建立的互联网传播能力体系,组织的各项能力相当不均衡。组织的互联网传播能力与组织年度收入、人员规模、专职技术人员、领导人工作年限、服务区域等,都呈一定的正相关关系。这可能会加剧公益组织的马太效应,也提醒更多公益组织要重视相关投入。
消息来源:NGO2.0


