Як створювалися перші комп’ютерні шрифти для китайських ієрогліфів

В кінці 1970-х і початку 1980-х років в Китаї не виготовлялися персональні комп’ютери. Щоб створити перший ПК з підтримкою китайської мови, команда американського вченого Брюса Розенблюма перепрограмувала Apple II та вручну намалювала й оцифрувала тисячі китайських ієрогліфів. Розповідаємо, на які труднощі натрапили дизайнери в процесі розробки одного з перших китайських шрифтів як з технічної, так і естетичної точок зору.

Технічні обмеження

Операційна система DOS 3.3 на Apple II не підтримувала введення і виведення тексту з китайськими ієрогліфами. Тому команді Розенблюма потрібно було написати власну операційну систему з нуля. Вчений також створив Gridmaster — текстовий редактор, на базі якого буде розроблений один з перших у світі китайських цифрових шрифтів. Програма була написана мовою програмування BASIC, і на її створення пішло кілька місяців.

Кодування китайського ієрогліфа диан (电, електрика) в Gridmaster на Sinotype III. Фото в тексті: Колекція Луї Розенблюма / Спеціальна колекція бібліотеки Стенфордського університету

Майбутній шрифт призначався для експериментального пристрою під назвою Sinotype III, який став одним з перших персональних комп’ютерів з підтримкою китайських ієрогліфів. Він був розроблений в Graphics Arts Research Foundation (GARF) в Кембриджі, Массачусетс.

Попри свою простоту, Gridmaster використовувалася для виконання складного дизайнерського завдання – створення цифрових растрових зображень для декількох тисяч китайських символів. Растрове зображення – це спосіб зберігання візуальної інформації в цифровому вигляді, наприклад у форматі JPEG, GIF або BMP, за допомогою сітки з пікселів.

Для створення китайського шрифту для Sinotype III потрібно було набагато більше часу, ніж програмування самого комп’ютера. Для кожного ієрогліфа дизайнерам треба було прийняти 256 різних рішень, по одному для кожного можливого пікселя в растровому зображенні. Таким чином, в процесі розробки, яка тривала понад два роки, були створені сотні тисяч таких рішень для тисяч ієрогліфів.

Завдяки Gridmaster батько Розенблюма, Луї Розенблюм, і співробітники GARF змогли приєднати до роботи цілу команду дизайнерів. Програма запускалася на будь-якому комп’ютері Apple II з дискети та дозволяла віддалено створювати й зберігати нові растрові зображення. Після цього Розенблюми могли завантажити їх в базу даних Sinotype III за допомогою іншої програми, також створеної Брюсом.

Китайський растровий шрифт на екрані Sinotype III. Фото в тексті: Колекція Луї Розенблюма / Спеціальна колекція бібліотеки Стенфордського університету

Комп’ютер Sinotype III так і не надійшов у продаж. Проте кропіткий процес його розробки, в тому числі створення растрового китайського шрифту, відіграв провідну роль в глобальних зусиллях по створенню комп’ютера з підтримкою китайської, однієї з найбільш широко використовуваних мов у світі.

Коли на Заході з’явилися комп’ютери та системи обробки тексту, інженери й дизайнери визначили, що цифровий шрифт в низькій роздільній здатності для англійської мови можна побудувати на растровій сітці розміром 5 на 7 пікселів. При такому підході:

  • один символ займав всього п’ять байтів пам’яті;
  • основні 128 символів (всі літери англійського алфавіту, цифри від 1 до 9 і поширені знаки пунктуації), які зберігалися в таблиці American Standard Code for Information Interchange (ASCII), вимагали всього 640 байтів пам’яті. Для порівняння: вбудована пам’ять Apple II становила 64 кілобайт.

Однак китайська мова містить десятки тисяч ієрогліфів, а сітка 5 на 7 не дозволяє зробити їх розбірливими. Для них був потрібний розмір 16 на 16 і більше, а значить, мінімум 32 байти (256 біт) припадало на один ієрогліф.

Таким чином, шрифт, який містить 70 тисяч китайських ієрогліфів в низькій роздільній здатності, займав би понад два мегабайти пам’яті. Навіть якби вона включала тільки 8 тисяч найпоширеніших ієрогліфів, було б потрібно приблизно 256 кілобайтів лише для зберігання растрових зображень. Це в чотири рази перевищує загальний обсяг пам’яті більшості персональних комп’ютерів на початку 1980-х років.

Естетичні рішення

Однак найсерйозніші завдання були пов’язані з естетикою і дизайном. Задовго до появи Gridmaster велика частина роботи виконувалася вручну. Дизайнери витратили роки на створення растрових зображень, які задовольняли б вимогам пам’яті та мінімально відповідали каліграфічній елегантності. Лілі Хуан-Мін Лін і Еллен Ді Джованні — одні з перших творців цифрового набору ієрогліфів, які працювали як вручну, так і за допомогою Gridmaster.

Основна проблема, з якою зіткнулися дизайнерки, полягала в досягненні балансу між двома абсолютно різними способами написання китайської:

  • ієрогліфами, написаними від руки за допомогою пера або кисті;
  • растровими знаками, створеними з набору пікселів, розташованих по двох осях.

Команді потрібно було вирішити, як краще відтворити деякі орфографічні особливості рукописної китайськї, такі як вступні, кінцеві та штрихи, що звужуються.

Прототипи китайського шрифту Sinotype III. Фото в тексті: Колекція Луї Розенблюма / Спеціальна колекція бібліотеки Стенфордського університету

Розробка та оцифрування шрифту для Sinotype III було ретельно задокументовано. Один з найцікавіших архівних джерел того періоду — тека, наповнена сітками з рукописними хеш-мітками — замальовками, які потім будуть перетворені в растрові зображення.

Кожен ієрогліф був ретельно продуманий і в більшості випадків відредагований Луї Розенблюмом та співробітниками GARF. Щоб «видалити біти», які не сподобалися редактору, використовувалася коригувальна рідина. Потім початкові зелені хеш-мітки покривалися червоними, що вказували фінальний варіант. Тільки після цього команда приступала до введення даних.

Правки ієрогліфа бай (背, ззаду). Фото в тексті: Колекція Луї Розенблюма / Спеціальна колекція бібліотеки Стенфордського університету

Команді потрібно було відтворити мінімум 3 тисячі растрових зображень, щоб задовольнити потреби користувачів. Тому можна припустити, що дизайнери прагнули оптимізувати роботу. Один зі способів — дублювання радикалів (базових компонентів ієрогліфа), коли вони представлені приблизно в тому ж місці, розмірі та орієнтації в декількох символах. Наприклад, для радикала «жінка» (女), можна було б створити тільки одне зображення, а потім продублювати його у всіх інших ієрогліфах.

Однак, згідно з архівними матеріалами, подібної оптимізації не проводилося. Навпаки, Луї Розенблюм наполягав на тому, щоб дизайнери адаптували кожен компонент до певного символу. Часто зміни були незначними, як, наприклад, в растрових зображеннях хуан (娟, витончений) і міан (娩, доставляти), кожен з яких містить радикал «жінка».

  • У хуан середня частина радикала «жінка» по горизонталі займає шість пікселів, в той час, як в міан — п’ять.
  • Нижній правий вигин цього радикала в міан відходить в сторону всього на один піксель, а в хуан цього штриха і зовсім немає.

Растрові символи хуан (娟, витончений) і міан (娩, доставляти) зі шрифту Sinotype III. Фото в тексті: Колекція Луї Розенблюма / Спеціальна колекція бібліотеки Стенфордського університету

Такий рівень точності простежувався в кожному символі та був скоріше правилом, ніж винятком.

У більшість фінальних ієрогліфів було внесено безліч змін в порівнянні з їх початковою версією. Наприклад, в нарисі луо (罗, збір, мережа) лінія в нижньому лівому кутку витягнута вниз рівно під кутом 45°, а потім переходить в цифрову версію нижнього штриха. Однак у фінальному варіанті крива «згладжена».

Порівняння двох версій ієрогліфа луо (罗, збір, мережа). Фото в тексті: Колекція Луї Розенблюма / Спеціальна колекція бібліотеки Стенфордського університету

Попри те, що дизайнерам потрібно було організувати відносно невеликий простір, їм доводилося приймати величезну кількість рішень. І кожне з них впливало на подальше — додавання навіть одного пікселя часто змінювало загальний горизонтальний і вертикальний баланс.

Найвиразніше це проявляється в проблемі досягнення симетрії. За правилами математики, вона вимагає простір непарного розміру і неможлива в растровій сітці парної розмірності, такій як 16 на 16. Щоб це виправити, в більшості випадків дизайнери використовували область 15 на 15. Це ще сильніше скорочувало розмір корисного простору.

Ієрогліфи шань (山, установка), чжун (中, середина), ри (日, сонце) і тянь (田, поле). Фото в тексті: Колекція Луї Розенблюма / Спеціальна колекція бібліотеки Стенфордського університету

До того ж растрові шрифти від різних компаній і проєктів не були однакові. Розглянемо радикал «вода» (氵) в шрифті Sinotype III в порівнянні з іншим раннім китайським шрифтом 1970-х і 1980-х років, творець якого — китайсько-американський психотерапевт і підприємець Х. С. Тянь.

Радикал «вода» (氵) в шрифті Sinotype III (праворуч) і Х. С. Тянь (зліва). Фото в тексті: Колекція Луї Розенблюма / Спеціальна колекція бібліотеки Стенфордського університету

Відмінності можуть здатися незначними. Однак вони демонструють лише одні з тисяч можливих рішень, які команді GARF треба було прийняти як в процесі розробки, так і оцифрування.

Звичайно, низька роздільна здатність недовго зберегла актуальність. Розвиток комп’ютерної техніки збільшило щільність растрових зображень і швидкість обробки, а також скоротило витрати на пам’ять. Можливо, зараз важко оцінити художню і технічну майстерність, що лежить в основі перших китайських растрових шрифтів. Однак саме це мистецтво розв’язання проблем в кінцевому підсумку призвело до широкого поширення комп’ютерів, нових медіа та інтернету.

БІЛЬШЕ ЦІКАВОГО:

Джерело: MIT Technology Review

Читайте также:

Хто винайшов телевізор — історія появи улюбленого девайса

Як вигадали Alt на клавіатурі? Історія клавіш-модифікаторів

Як завдання набору китайського тексту призвела до створення автозаповнення

4 з 10 перекладачів втрачають роботу через штучниий інтелект