9 月 21 日,iOS 15 和 iPadOS 15 正式发布,这一次更新,apple 为其移动端设备带来了诸多实用功能,尽管此次更新少见大刀阔斧的改变,但细微之处的功能打磨却处处可见。
在第一次体验到「实况文本」这一功能的时候,我联想到了大学时期,在课堂上举着 iPad mini 拍下一张又一张照片,然后匆匆将照片添加到笔记应用里就没了后续的自己,没有多少人会勤奋到课下再去把照片上的文字手动整理一遍,于是这些无效笔记只能成为我假装努力的证明。
没有想到时隔多年,只要将镜头对着文字,手机就能够自动帮你识别文字并允许你快速复制并进入编辑环节的场景真的能够实现,这得益于 iOS 15 和 iPadOS 15 为我们带来的「实况文本」这一强大功能。
什么是「实况文本」
实况文本(Live Text)是 apple 为 iOS 15 和 iPadOS 15 新增的实用功能之一,简单来说,实况文本能够帮助我们把照片、屏幕乃至相机预览界面当中的文字转化为可供编辑的文本,我们也可以将其视作系统级的 OCR 工具。在 apple 官网中,实况文本功能被简单分为了照片中的实况文本、相机中的的实况文本、实况文本翻译三个主要分支功能。
顾名思义,照片中的实况文本意味着我们可以轻松识别照片当中的文字,并对识别后的文字使用诸如拷贝和粘贴、查询以及翻译等功能,我们甚至可以在系统识别到文字当中的邮件、电话号码乃至地址后直接调取相应的功能。
当我们将手机镜头对准任意文字时,便能触发相机中的实况文本功能,从而在相机取景框直接获取到我们需要的内容;在通过实况文本获取到相应的文字后,我们还能将文字通过实况文本翻译转化为 7 种不同的语言:英语、中文、法语、意大利语、德语、葡萄牙语和西班牙语。
根据官网介绍:
实况文本功能适用于照片 app、截屏、快速查看、Safari 浏览器, 以及用相机 app 进行的实时预览……在配备 A12 仿生或后续芯片的 iPhone 上提供。
在实际测试中,升级了 iPadOS 15 的 iPad mini 5(配备 A12 仿生芯片)同样可以识别照片 app、截屏当中的文字。
除了实况文本这一功能,apple 在 WWDC21 大会上还介绍了名为 Visual Look Up 的一项功能,这一功能可以帮助用户识别相片中的场景、物品,支持的内容范围包括动植物、绘画、书本、建筑等各种信息,可以视作实况文本功能的加强版和补充,功能类似于 Google 早先推出的 Google Lens。不过,这项功能暂时没有出现在 iOS 15 的第一个正式版本中。
怎么用「实况文本」
作为一项系统级功能,实况文本功能具备多种触发方式,能够最大意义上为用户所用,具体的触发方式有以下几种:
相机取景框触发
打开 iPhone 上的相机应用,将镜头对准任意有文字内容的画面,我们都能够在取景框中看到实况文本按钮,点击该按钮后文字所在区域会以悬浮窗口的形式呈现,此时,这一窗口中的所有文字内容都能够被直接选取从而进行后续的复制、分享、查询乃至翻译等操作。
相册 app 自动识别照片文字
除了相机取景框,我们还能够在系统相册当中体验实况文本功能,打开任意包含文字内容的图片后,我们都能在图片下方看到实况文本按钮,这意味着该图片当中的文字均能够进行点选。
而对于一些仅包含极少量文字的图片,尽管实况文本按钮不会出现,但是通过长按,这一部分文字仍然是可以被选中的。更为惊喜的是,通过在系统的聚焦功能中搜索,我们还能够在搜索结果中获取到包含相关文字的照片。
截屏界面触发
在 iOS 15 和 iPadOS 15 中,用户能够在截屏后直接看到实况文本按钮,通过这一操作,我们能够将以往不允许直接复制的文字内容通过截屏后识别获取,整体操作非常简便,用完即走。
任意界面点选输入框触发
实况文本功能还出现在系统的各个位置,可以这样说:只要有输入框的位置,就一定有实况文本功能的身影。
通过在任意界面点选输入框,我们都能够菜单中看到实况文本按钮,点击该按钮,系统键盘会被相机取景器所取代,此时将手机镜头对准任意想要识别的文字,相应的文字内容会被自动识别并填充到输入框中。
这一功能已经在新系统发布后被众多笔记、编辑器应用支持,这也意味着,我们可以在移动手机镜头的过程中就轻松输入书本上或屏幕上的文字。
效果怎么样
不得不说,iOS 实况文本这一系统级功能的加入对于一众主打 OCR 功能的应用而言无疑是一种强势挑战,但对于文本编辑类应用而言却是一件意外之喜。
以往如果我们想要将照片或所拍摄屏幕上的文字保存为文本格式,少不了要经历拍摄、分享至第三方应用、识别、点选复制、编辑等多个步骤,实况文本的加入能够帮助我们直接减少中间环节,允许我们直接复制取景框和图片中的文字。
因此单纯论使用的便捷性,实况文本这一系统级功能无疑更加方便易用,更何况它还完全免费。
不过这是否就意味着第三方扫描应用和 OCR 应用从此就毫无用武之地了呢?答案是否定的,如果你有大量扫描分档并进行文字识别的需求,第三方应用能够为你带来更加畅快、专业的扫描功能支持,且类似与《白描》这样的应用还允许我们在扫描多页文档后,对文档内容统一进行 OCR 识别,这一点实况文本暂时做不到。
此外,第三方应用如《Scanner Pro》对于扫描好的文档能够做到分门别类的归档和整理,这一功能对于需要留存原始资料的人群而言非常重要,而实况文本更多地为我们带来了识别完就走的畅快感,但在资料留存和归档上却略有短板。
总结
总的来说,实况文本最大限度地降低了用户使用 OCR 功能的门槛,或许以后向你询问怎么把屏幕上的文字快速复制下来的人会越来越少,这一功能同样为大量文本编辑和笔记应用带来了广阔的应用空间,从此,做书摘、快速引用书内文字都将变得无比简单。
当然,文字的快速识别只是第一步,而手机背后的人如何使用文字,如何让这一功能真正辅助于生活和学习、工作,才是更加值得我们去探索和思考的事情,正如把屏幕上的一张张 PPT 拍下来只是开始,将文字内化为属于自己的知识才应该是根本目标。