Conventions

Écriture & transcription
Les conventions d’écriture, de transcription et de ponctuation suivent celles retenues par Haruo Shirane dans sa grammaire, Classical Japanese: A Grammar, Columbia University Press, 2005. L’écriture japonaise est rendue selon les règles en usage avant la réforme générale des années 1946-1949.

Les caractères chinois (kanji 漢字) sont normalement écrits dans leur ancienne graphie, ici au format standardisé unicode. Exemple : 仏 (nouvelle graphie) > 佛 (ancienne graphie). En cas d'indécision, les choix opérés dans l'édition électronique du canon sino-japonais de Taishō prévalent.


• L’écriture des kana suit la transcription ancienne (kyūkanazukai 旧仮名遣).
Les sons assimilés (sokuon ‪促音‬) ne sont pas marqués, つ est conservé : まつたく et non まったく.
Les sons contractés (yōon 拗音) ne sont pas marqués : じや et non じゃ.

La transcription romanisée suit le système Hepburn modifié avec les règles suivantes :
は, ひ, ふ, へ, ほ sont transcrits a, i, u, e, o sauf à l’initiale. は, particule ou au milieu d’un mot, est transcrit wa.
ゐ, ゑ, を sont transcrits par par i, e, o.
ん est transcrit n devant m p et b, n’ devant une voyelle.
Les voyelles longues sont marquées par un macron.

Encodage
Les caractères sont au format unicode (dernière version 6.2.de 2012). Les caractères qui ne sont pas reconnus par les navigateurs ou qui ne sont pas disponibles en unicode sont au format image. L’image est accompagnée d’une infobulle avec le numéro du caractère dans les tables unicode lorsqu’il est disponible.

Particularités
Afin de faciliter les recherches d’occurrences dans les textes, ceux-ci ont été revus et corrigés. Dans les versions électroniques présentes sur le site, ne sont pas utilisés :
- Le katakana : l’ensemble des textes sont transcrits en hiragana.
- Les kana phonétiques (furigana 振り仮名)
- Les ligatures (gōji 合字 ) : ゟ est transcrit par より par exemple.
- Les marques d’inversion (kaeriten 返り点 ) du style chinois (kanbun 漢文).
- Les marques d’itération (doriji 踊り字) : 人々 est transcrit par 人人.
- Le séparateur (heiretsuten 竝列点), noté「・」.

Trois marques de ponctuation (kusetsuten 句切点) sont par contre utilisées :
- Le point (kuten 句點) noté「。」.
- La  virgule (tōten 讀點), notée 「、」.
- Les crochets simples (kagikakko 鉤括弧) notés「」.