Quantcast
Channel: rfcタグが付けられた新着記事 - Qiita
Viewing all articles
Browse latest Browse all 193

[Joke-RFC] RFC9226 Bioctal: Hexadecimal 2.0

$
0
0
はじめに この文書は RFC9226 を勉強と好奇心のため適当に訳したものです。 翻訳の正確さは全く保証しません。 誤字誤訳等の指摘はいつでも大歓迎です。 Bioctal: Hexadecimal 2.0 Independent Submission Request for Comments: 9226 Category: Experimental ISSN: 2070-1721 M. Breen mbreen.com 1 April 2022 Abstract(概要) The prevailing hexadecimal system was chosen for congruence with groups of four binary digits, but its design exhibits an indifference to cognitive factors. An alternative is introduced that is designed to reduce brain cycles in cases where a hexadecimal number should be readily convertible to binary by a human being. 一般的な16進数は、2進数4桁のグループとの整合性から選択されたが、その設計は認知的要因に無関心であることがわかる。 そこで、人間が2進数に変換しやすい、脳内サイクルを減らすように設計された16進数の代替形式を紹介する。 Status of This Memo(このメモの位置づけ) This document is not an Internet Standards Track specification; it is published for examination, experimental implementation, and evaluation. この文書はインターネット標準ではなく、検討、実験的な実装、評価のために公開されたものである。 This document defines an Experimental Protocol for the Internet community. This is a contribution to the RFC Series, independently of any other RFC stream. The RFC Editor has chosen to publish this document at its discretion and makes no statement about its value for implementation or deployment. Documents approved for publication by the RFC Editor are not candidates for any level of Internet Standard; see Section 2 of RFC 7841. この文書は、インターネットコミュニティのための実験的プロトコルを定義するものである。 この文書は、他のRFCストリームとは無関係に、RFCシリーズに貢献するものである。 RFCエディタは自らの裁量でこの文書を公開することを選択し、実装や配備におけ るこの文書の価値については一切言及しない。 RFCエディタによって公開が承認された文書は、どのレベルのインターネット標準の候補にもならない(RFC 7841のセクション2を参照のこと)。 Information about the current status of this document, any errata, and how to provide feedback on it may be obtained at https://www.rfc-editor.org/info/rfc9226. この文書の現在の状態、正誤表、それに対するフィードバックの方法に関する情報は、https://www.rfc-editor.org/info/rfc9226 で入手できる。 Copyright Notice Copyright (c) 2022 IETF Trust and the persons identified as the document authors. All rights reserved. This document is subject to BCP 78 and the IETF Trust's Legal Provisions Relating to IETF Documents (https://trustee.ietf.org/license-info) in effect on the date of publication of this document. Please review these documents carefully, as they describe your rights and restrictions with respect to this document. Table of Contents(目次) 1. Introduction 1.1. The Pernicious Advance of Hexadecimal 1.2. Problems with Hexadecimal 1.3. Other Proposals 2. Bioctal 3. Objections to Be Dismissed 4. Security Considerations 5. IANA Considerations 6. Conclusion 7. Informative References Acknowledgments Author's Address 1. Introduction(導入) 1.1. The Pernicious Advance of Hexadecimal(16進数の悪しき広がり) Octal has long been used to represent groups of three binary digits as single characters, and that system has the considerable merit of not requiring any digits other than those already familiar from decimal numbers. Unfortunately, the increasing use of 16-bit machines and other machines that have word lengths that are evenly divisible by four (but not by three) has led to the widespread adoption of hexadecimal. Table 1 presents the digits of the hexadecimal alphabet. 8進数は2進数の3桁を1文字で表す方式で、10進数でおなじみの桁以外の数字を必要としないという大きなメリットがある。 しかし、16ビット機などワード長が4で割り切れる(3では割り切れない)機械の普及に伴い、16進法が広く採用されるようになったのは残念なことである。 16進数のアルファベットの桁数は表1のとおり。 +=======+=======+ | Value | Digit | +=======+=======+ | 0 | 0 | +-------+-------+ | 1 | 1 | +-------+-------+ | 2 | 2 | +-------+-------+ | 3 | 3 | +-------+-------+ | 4 | 4 | +-------+-------+ | 5 | 5 | +-------+-------+ | 6 | 6 | +-------+-------+ | 7 | 7 | +-------+-------+ | 8 | 8 | +-------+-------+ | 9 | 9 | +-------+-------+ | 10 | A | +-------+-------+ | 11 | B | +-------+-------+ | 12 | C | +-------+-------+ | 13 | D | +-------+-------+ | 14 | E | +-------+-------+ | 15 | F | +-------+-------+ Table 1: The Hexadecimal Alphabet The choice of alphabet is clearly arbitrary: On the exhaustion of the decimal digits, the first letters of the Latin alphabet are used in sequence for the remaining hexadecimal digits. An arbitrary alphabet may be acceptable on an interim or experimental basis. However, given the diminishing likelihood of a return to 18-bit computing, a review of this choice of alphabet is merited before its use, like that of the QWERTY keyboard, becomes too deeply established to permit the easy adoption of a more logical alternative. アルファベットの選択は明らかに恣意的である。10進数を使い切ると、残りの16進数にはラテンアルファベットの最初の文字が順番に使われる。 暫定的あるいは実験的に、任意のアルファベットを使用することは可能である。 しかし、18ビットコンピュータに戻る可能性が低くなっていることを考えると、QWERTYキーボードのように、このアルファベットの使用があまりにも深く定着して、より論理的な代替手段を容易に採用できなくなる前に、このアルファベットの選択について見直すことが必要であろう。 1.2. Problems with Hexadecimal(16進数に関する問題点) One problem with the hexadecimal alphabet is well known: It contains two vowels, and numbers expressed in hexadecimal have been found to collide with words offensive to vegetarians and other groups. 16進数には2つの母音が含まれており、16進数で表現した数字がベジタリアンなどにとって不快な言葉と衝突してしまうという問題があることはよく知られています。 Imposing a greater constraint on the solution space, however, is the difficulty of mentally converting a number expressed in hexadecimal to (or from) binary. Consider the hexadecimal digit 'D', for example. First, one must remember that 'D' represents a value of 13 -- and, while it may be easy to recall that 'F' is 15 with all bits set, for digits in the middle of the non-decimal range, such as 'C' and 'D', one may resort to counting ("A is ten, B is eleven, ..."). Next, one must subtract eight from that number to arrive at a number that is in the octal range. Thus, the benefit of representing one additional bit incurs the cost of two additional mental operations before one arrives at the position where the task that remains reduces to the difficulty of converting the remaining three digits to binary. 16進数で表された数字を2進数に変換するのは、精神的に大変な作業であり、解答空間に大きな制約を与える。 例えば、16進数のDという数字を考えてみる。 CやDのように10進数でない中間の桁の場合、「Aは10、Bは11、...」と数えることになる。 次に、その数から8を引くと8進数の数字になる。 このように、1ビット増えるという利点は、残りの3桁を2進数に変換するという難題に辿り着くまでに、2つの精神的な操作を追加するという犠牲を払っている。 These mental steps are not difficult per se, since a child could do them, but if it is possible to avoid employing children, then it should be avoided. An appeal to the authority of cognitive psychology is perhaps also due here, in particular to the "seven plus or minus two" principle [Miller] -- either because octal is within the upper end of that range (nine) and hexadecimal is not, or else because the difference in the size of the alphabets is greater than the lower end of that range (five). Either way, it is almost certainly relevant. このような心のステップは、子供でもできることなので、それ自体は難しいことではないが、子供を雇うことを避けることが可能であるならば、それは避けるべきであろう。 認知心理学の権威への訴えることは、ここでもおそらく、特に「7、プラスマイナス2」の原則 [Miller] によるものである。 8進数がその範囲の上限(9)であり16進数がそうでないからか、あるいはアルファベットの大きさの違いがその範囲の下限(5)よりも大きいからか、どちらかであるだろう。 いずれにせよ、ほぼ間違いなく関連性がある。 1.3. Other Proposals(他の提案) Various alternatives have already been suggested. Some of these are equally arbitrary, e.g., in selecting the last six letters of the Latin alphabet rather than the first six letters. 既に様々な代替案が提案されている。 例えば、ラテンアルファベットの最初の6文字ではなく、最後の6文字を選択するなど、同様に恣意的なものもある。 The scheme that comes closest to solving the main problem to date is described by Bruce A. Martin [Martin] who proposes new characters for the entire octal alphabet. While his principal motivation is to distinguish hexadecimal numbers from decimals, the design of each character uses horizontal lines to directly represent the "ones" of the corresponding binary number, making mental translation to binary a trivial task. これまでの主な問題解決に最も近い方式は、8進数のアルファベット全体に新しい文字を提案する Bruce A.Martin [Martin] によるものである。 彼の主な動機は、16進数と10進数を区別することだが、各文字のデザインは、水平線を使用して対応する2進数の「1」を直接表し、2進数への精神的な変換を簡単な作業にする。 Unfortunately for this and other proposals involving new symbols, proposals to change the US-ASCII character set [USASCII] might no longer be accepted. Also, it seems unrealistic to expect keyboards or printer type elements (whether of the golf ball or daisy wheel kind) to be replaced to accommodate new character designs. この提案や新しいシンボルを含む他の提案にとって残念なことに、US-ASCII文字セット [USASCII] を変更する提案は、もはや受け入れられないかもしれないことである。 また、キーボードやプリンタのタイプエレメント(ゴルフボールやデイジーホイールの類)が、新しい文字デザインに対応するために交換されることを期待するのは非現実的だと思われる。 2. Bioctal Table 2 presents the hexadecimal alphabet once again, this time in a sequence of two octaves with values increasing left to right and top to bottom. 表2は、16進数のアルファベットを2つのオクターブずつ、左から右、上から下へと値を増やしていったものである。 +---+---+---+---+---+---+---+---+ | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | +---+---+---+---+---+---+---+---+ | 8 | 9 | A | B | C | D | E | F | +---+---+---+---+---+---+---+---+ Table 2: The Hexadecimal Alphabet in Sequential Octaves Arranged thus, the binary representation of each digit in the second octave is the same as the digit above it, but with the most significant of the four bits set to '1' instead of '0'. このように並べると、第2オクターブの各桁の2進表現は、その上の桁と同じだが、4ビットのうち最上位が「0」ではなく「1」になる。 The incongruity of two decimal digits in the second octave also suggests that, in blindly aligning with four bits, hexadecimal (six plus ten, neither of which are powers of two) misses an opportunity to align also with three bits. 10進数が2つ、2オクターブ目にあるのも不自然で、16進数(6+10、いずれも2の累乗)では、やみくもに4ビットに揃えることで、3ビットにも揃える機会を逸していることを示唆している。 Bioctal restores congruence by replacing the second row with characters mnemonically related to the corresponding character in the first octave. Bioctalでは、2列目を1オクターブの対応する文字とニーモニックに関連する文字に置き換えることで、整合性を回復する。 Table 3 shows the compelling result. 表3は、説得力のある結果をしめしている。 +---+---+---+---+---+---+---+---+ | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | +---+---+---+---+---+---+---+---+ | c | j | z | w | f | s | b | v | +---+---+---+---+---+---+---+---+ Table 3: Bioctal in Sequential Octaves The mnemonic basis is the shape of the lowercase character. This is seen directly for '2', '5', and '6'. For '3', '4', and '7', the corresponding letters are the result of a quarter-turn clockwise (assuming an "open" '4'). The choice of 'c' and 'j' for '0' and '1' avoids vowels and lowercase 'L', the latter being confusable with '1' in some fonts. ニモニックの基本は、小文字の形である。 '2'、'5'、'6'については、これが直接わかる。 '3'、'4'、'7'については、対応する文字が時計回りに1/4回転した結果である('4'を「開いた」状態と仮定する)。 '0' と '1' に 'c' と 'j' を選択することで、母音と小文字の 'L' を避けることができる(後者は一部のフォントで '1' と混同されることがある)。 With this choice of letters, it is immediately evident that both problems with hexadecimal are solved. Mental conversion is now straightforward: if the digit is a letter, then the most significant of the four binary bits is '1', and the remaining three bits are the same as for the Arabic numeral with the same shape in the first octave. この文字の選択によって、16進法の問題点が2つとも解決されたことがすぐにわかる。 精神的な変換はこれで容易である。 桁が文字であれば、2進数の4ビットのうち最上位は「1」、残りの3ビットは第1オクターブの同じ形をしたアラビア数字と同じになる。 3. Objections to Be Dismissed(却下する反論) Several objections can be anticipated, the first of which concerns the name. The term "bioctal" is already used to refer to the combination of two octal characters into a single field on, for example, paper tape (e.g., [UNIVAC]). However, if the word "bioctal" must be disadvantaged relative to words such as "biannual" in the number of meanings it is allowed to have, then it is the paper tapers who must give way: in that context, the "octal" part of "bioctal" refers to the number of distinct values that three bits can have, while the "bi" refers to a doubling of the number of bits, not values. A meaning depending on such a discordant etymology does not deserve to endure. いくつかの異論が予想されるが、まずは名称に関するものである。 「bioctal」という用語は、例えば紙テープ上で2つの8進文字を組み合わせて1つのフィールドにすることを指すのに既に使われている(例えば [UNIVAC] )。 しかし、「bioctal」という単語が「biannual」などの単語に比べて許される意味の数で不利にならざるを得ないのであれば、道を譲るべきは紙テープの方である。 この文脈では、「bioctal」の「octal」の部分は3ビットが持ち得る異なる値の数を指し、「bi」は値ではなくビット数の2倍を指している。 このような矛盾した語源に依存する意味は、存続する価値がない。 Second, it may be argued that the use of hexadecimal has already become too entrenched to be changed in the short term: Bioctal should be introduced only after those working in the industry who have grown accustomed to hexadecimal have retired. Such a dilatory contention cannot be allowed to impede the march of progress. Instead, any data entry technician who claims to have difficulty with bioctal may be reassigned to duties involving only binary numbers. 二点目として、16進数の使用はすでに定着しており、短期的に変更するのは難しいという意見がある。 16進数に慣れた人たちが退職した後に、Bioctalを導入すればよい。 そんな悠長な争いで、進歩が阻害されることは許されない。 その代わりに、bioctalが苦手だというデータ入力技術者は、2進数のみの業務に配置換えしてもよい。 A third possible objection is that numbers in bioctal do not sort numerically. However, this assumes a sort based on the US-ASCII order of symbols; it is quite possible that bioctal numbers sort naturally in some lesser known variety of EBCDIC. Further, resistance to numeric sorting may be an indicator of virtue, being suggestive of an alphabet with a certain strength of character. 三点目の反論は、bioctalの数値は数値的にソートされないというものである。 しかし、これは US-ASCII の記号の順序に基づくソートを想定している。 Bioctalの数字は、あまり知られていない EBCDIC の種類で自然にソートされる可能性が十分にある。 さらに、数字のソートへの抵抗は美徳の指標である可能性があり、特定の文字の強さを持つアルファベットを示唆している。 One difficulty remains: Not all computers support lowercase letters. While this is indeed true, it should be confirmed in any particular instance: the author has observed that in many cases a machine having a keyboard with buttons marked only with uppercase letters also supports lowercase letters. In any case, it is permissible to use uppercase letters instead of the lowercase ones of Table 3; the morphology mnemonic continues to work for most bioctal digits in uppercase, although an extra mental cycle is required for 'B'. 一つだけ難点が残っている。すべてのコンピュータが小文字をサポートしているわけではないことである。 大文字のボタンしかないキーボードを持つマシンも、多くの場合、小文字にも対応していることを筆者は確認している。 いずれにせよ、表3の小文字の代わりに大文字を使うことは許される。 形態素解析ニモニックはほとんどの bioctal に対して大文字でも機能し続けるが、'B'については追加のメンタルサイクルが必要である。 4. Security Considerations(セキュリティに関する考察) The letters 'b' and 'f' appear in both the bioctal and hexadecimal alphabets, which makes potential misinterpretation a concern. A case of particular hazard arises where two embedded systems engineers work to develop a miniature lizard detector designed to be worn like a wristwatch. One engineer works on the lizard proximity sensor and the other on a minimal two-character display. The interface between the circuits is 14 bits. To make things easier, the engineer working on the display arranges for these bits to be set in a pattern that allows them to be used directly as two seven-bit US-ASCII characters indicating the most significant lacertilian species detected in the vicinity of the device. Due to the use of an old US-ASCII table (i.e., one in hex, not bioctal) and human error, some of the values specified as outputs for the detection subsystem are in hexadecimal, not the bioctal the engineer developing that subsystem expects -- including, in the case of one type of lizard, "4b 4f". The result is that the detector displays "NL" (No Lizards) when it should display "KO" (Komodo dragon). This may be considered prejudicial to the security of the user of the device. 'b'と'f'の文字は、bioctalと16進数の両方に存在するため、誤認識の可能性が懸念される。 特に危険なケースは、2人の組み込みシステムエンジニアが腕時計のように装着できる小型のトカゲ検出器の開発に取り組んでいる場合である。 一人はトカゲの近接センサーを、もう一人は最小限の2文字ディスプレイを開発している。 両者の回路間のインターフェースは14ビット。 このビットがそのまま7ビットのUS-ASCII文字として使用できるように、ディスプレイのエンジニアがビットを設定する。 古いUS-ASCIIテーブル(つまり、bioctalではなく16進数)の使用とヒューマンエラーにより、検出サブシステムの出力として指定された値のいくつかは、そのサブシステムを開発するエンジニアが期待するbioctalではなく16進数となる場合 —— ある種のトカゲの場合には「4b 4f」を含む。 その結果、検出器は「KO」(コモドオオトカゲ)と表示すべきところを「NL」(トカゲなし)と表示することになる。 これは、装置の使用者の安全性を損なうと考えられる。 Extensive research has uncovered no other security-related scenarios to date. 広範な調査により、現在までに他のセキュリティに関連するシナリオは発見されていない。 5. IANA Considerations(IANA 検討事項) This document has no IANA actions. この文書にはIANAアクションはない。 6. Conclusion(結論) Bioctal is a significant advance over hexadecimal technology and promises to reduce the small (but assuredly non-zero) contribution to anthropogenic global warming of mental hex-to-binary conversions. Since the mnemonic basis of the alphabet is independent of English or any other particular natural language, there is no reason that it should not be adopted immediately around the world, excepting perhaps certain islands of Indonesia to which Varanus komodoensis is native. Bioctalは16進法の技術を大きく前進させ、16進法から2進法への精神的な変換による人為的な地球温暖化への寄与を小さく(しかし確実にゼロではない)することを約束するものである。 このアルファベットのニモニックベースは、英語やその他の自然言語とは無関係なので、 コモドオオトカゲ が生息するインドネシアの特定の島を除いて、世界中で直ちに採用されない理由はない。 7. Informative References [Martin] Martin, B. A., "Letters to the editor: On binary notation", Communications of the ACM, Vol. 11, No. 10, DOI 10.1145/364096.364107, October 1968, https://doi.org/10.1145/364096.364107. [Miller] Miller, G. A., "The Magical Number Seven, Plus or Minus Two: Some Limits on Our Capacity for Processing Information", Psychological Review, Vol. 101, No. 2, 1956. [UNIVAC] Sperry Rand Corporation, "Programmers Reference Manual for UNIVAC 1218 Computer", Revision C, Update 2, November 1969, http:/bitsavers.computerhistory.org/pdf/univac/military/1218/PX2910_Univac1218PgmrRef_Nov69.pdf. [USASCII] American National Standards Institute, "Coded Character Set -- 7-bit American Standard Code for Information Interchange", ANSI X3.4, 1986. Acknowledgments The author is indebted to R. Goldberg for assistance with Section 4. Author's Address Michael Breen mbreen.com Email: rfc@mbreen.com

Viewing all articles
Browse latest Browse all 193

Trending Articles