Як завдання набору китайського тексту призвела до створення автозаповнення

Коли користувач друкує китайською, використовуючи стандартну клавіатуру, він вводить ланцюжок символів на кшталт «ymiw2klt4pwyy» і отримує послідовність ієрогліфів. Ця система з’явилася ще 1959 року на комп’ютері Sinotype. Сьогодні вона використовується практично на всій обчислювальній техніці у вигляді відомого автозаповнення. Решта світу познайомився з функцією лише через десятки років.

У 1985 році Барбара Блекберн увійшла до книги рекордів Гіннеса завдяки швидкості друку на машинці – цілих 170 англійських слів за хвилину. Пізніше її результат перевершив Шон Врона – він міг набрати на комп’ютерній клавіатурі 174 слова за хвилину.

У 2013 році ще визначніший результат показав переможець Національного конкурсу набору китайських ієрогліфів Хуан Чжен’юй. Його швидкість становила 221,9 ієрогліфа за хвилину.

Тільки уявіть: 3,7 ієрогліфа за секунду. Якби він друкував англійською, то став би новим рекордсменом книги Гіннеса.

Письмова система китайської мови використовує так багато знаків, що адаптувати його для машинного набору є непростим завданням. Телеграфний зв’язок існує в Китаї з 1870-х років, і весь цей час максимальна швидкість друку операторів сягала кількох десятків символів за хвилину. Після появи машинного друку (з 1920-х по 1970-ті) рекорд становив близько 80 символів за хвилину.

І все-таки друк китайською наздогнала і навіть почала перевершувати швидкість комп’ютерного набору тексту, зафіксовану в інших частинах світу. Як це відбулося?

У китайських обчислювальних та цифрових пристроях використовуються спеціальні програми – редактори методу введення (input method editors, IME). Це програми-посередники, які пов’язують апаратні пристрої користувача з іншою програмою або додатком.

Щоразу, коли хтось пише китайською в Microsoft Word, шукає щось у мережі або надсилає текстові повідомлення, підключається IME. Програма перехоплює удари по клавішах та намагається визначити, які китайські символи потрібні користувачеві. Простіше кажучи, ланцюжок тексту на кшталт «ymiw2klt4pwyy» перетворюється на послідовність ієрогліфів.

Приклад спливаючого меню редактора методу введення китайською мовою

У китайських обчислювальних системах підсумковий текст завжди відрізнятиметься від символів, які вводив користувач. Здається неймовірною для інших мов, але для китайської це буденність.

Цей принцип вперше був використаний в китайському комп’ютері Sinotype, представленому в 1959 професором Массачусетського технологічного інституту Семюелом Хоксом Колдуеллом і Фондом досліджень графічних мистецтв.

Комп’ютер оснащений клавіатурою QWERTY. З її допомогою оператор вводив китайські ієрогліфи — але не звуки, що позначають ієрогліфи, а риски, з яких складалися ієрогліфи. Sinotype не додавав на сторінку один ієрогліф за іншим. Кожен штрих «правопису» служив електронною адресою, яку логічна схема Sinotype використовувала для отримання китайського ієрогліфа з пам’яті.

Колдуелл виявив несподівані переваги методу — абсолютно нечувані в контексті англомовної взаємодії людини та машини на той час. Він не лише заощаджував оперативну пам’ять, а й дозволяв швидше друкувати.

Перший китайський комп’ютер в історії був заснований на тому ж принципі, яким користувався Хуан Чженьюй у 2013 році.

Сьогодні ця технологія відома нам як автозаповнення. Вона дозволяє людині взаємодіяти з комп’ютером через додаткові інструменти швидше, ніж це відбувалося б безпосередньо. І вона з’явилася в китайській обчислювальній техніці на десятки років раніше, ніж стала відома на Заході.

БІЛЬШЕ ЦІКАВОГО:

Джерело: MIT

Читайте также:

4 китайські єдинороги, які створюють альтернативу ChatGPT

Вперше за 30 років на клавіатурі Windows з’явиться нова клавіша

Криза геймдева в Японії та вихід китайських інвесторів на ці терени

Shenzhen Zhongshuge: як влаштований найфантастичніший книжковий магазин у світі