terraの開発ノート ftp.unicode.org
★index ▲戻る
以下はunicode.org のftpのページ のイメージです。
◆リンク
◆ミラーサイト ftp://ftp.unicode.org/Public/
FTP ディレクトリ /Public/ / ftp.unicode.org
エクスプローラーでこの FTP サイトを表示するには、Alt キーを押して、表示 をクリックして、エクスプローラーで FTP サイトを開く をクリックしてください。
--------------------------------------------------------------------------------
1 階層上のディレクトリへ
12/16/2009 12:00午前 ディレクトリ 1.1-Update
03/24/2005 12:00午前 ディレクトリ 2.0-Update
02/27/2001 12:00午前 ディレクトリ 2.1-Update
02/27/2001 12:00午前 ディレクトリ 2.1-Update2
02/27/2001 12:00午前 ディレクトリ 2.1-Update3
02/27/2001 12:00午前 ディレクトリ 2.1-Update4
03/24/2005 12:00午前 ディレクトリ 3.0-Update
02/27/2001 12:00午前 ディレクトリ 3.0-Update1
03/24/2005 12:00午前 ディレクトリ 3.1-Update
08/14/2001 12:00午前 ディレクトリ 3.1-Update1
03/24/2005 12:00午前 ディレクトリ 3.2-Update
03/24/2005 12:00午前 ディレクトリ 4.0-Update
03/30/2004 12:00午前 ディレクトリ 4.0-Update1
04/01/2005 12:00午前 ディレクトリ 4.1.0
07/15/2006 12:00午前 ディレクトリ 5.0.0
04/04/2008 12:00午前 ディレクトリ 5.1.0
09/30/2009 12:00午前 ディレクトリ 5.2.0
10/11/2010 12:00午前 ディレクトリ 6.0.0
05/17/2012 12:00午前 ディレクトリ 6.1.0
09/24/2012 12:00午前 ディレクトリ 6.2.0
05/14/2013 11:23午後 ディレクトリ 6.3.0
06/20/2013 09:36午後 ディレクトリ 7.0.0
11/19/2003 12:00午前 ディレクトリ MAPPINGS
11/12/2009 12:00午前 ディレクトリ PROGRAMS
11/01/2001 12:00午前 797 ReadMe.txt
11/27/2012 12:00午前 ディレクトリ UCA
05/31/2013 07:39午後 ディレクトリ UCD
09/26/2012 12:00午前 9 UNIDATA
05/14/2013 07:06午後 ディレクトリ cldr
09/26/2012 12:00午前 ディレクトリ idna
11/10/2011 12:00午前 ディレクトリ math
10/27/2004 12:00午前 ディレクトリ reconstructed
07/23/2012 12:00午前 ディレクトリ security
05/29/2013 05:37午後 ディレクトリ vertical
09/24/2012 12:00午前 ディレクトリ zipped
--------------------------------------------------------------------------------
上記のツリー構造(全体構造とmappingsの詳細)
┳┳歴史的バージョン
┃┣1.1-update
┃┣2.0-update
┃┣2.1-update
┃┣2.1-update2
┃┣2.1-update3
┃┣2.1-update4
┃┣3.0-update
┃┣3.0-update1
┃┣3.1-update
┃┣3.1-update1
┃┣3.2-update
┃┣4.0-update
┃┣4.0-update1
┃┣4.1.0
┃┣5.0.0
┃┣5.1.0
┃┣5.2.0
┃┣6.1.0
┃┣6.2.0
┃┣6.3.0
┃┗7.0.0
┃
┣Mappings
┃┣EASTASIA
┃┣ESTI - GSM0338.TXT
┃┣ISO8859
┃┃┣ 8859-1.TXT ~8859-16.TXT
┃┃┗DatedVersions - 上記の歴史的バージョン
┃┣OBSOLETE(廃止予定)
┃┃┣EASTASIA
┃┃┃┣JIS JIS0201,0208,0212,SHUFTJIS.TXT
┃┃┃┣KSC 韓国関係
┃┃┃┣OTHERS BIG5.TXT,CNS11643.TXT 台湾関係
┃┃┃┗TCVN ベトナム関係
┃┃┗UNI2SGML.TXT SGML化資料か
┃┗VENDORS
┃ ┣ADOBE アドビ社資料
┃ ┣APPLE 各国データからの移行資料あり
┃ ┣IBM IBM社とのリンクのみ
┃ ┣MICSFT マイクロソフト社
┃ ┃┣EBCDIC
┃ ┃┣MAC
┃ ┃┣PC
┃ ┃┣WINDOWS
┃ ┃┗WindowsBestFit
┃ ┣MISC
┃ ┗NEXT
┣PROGRAMS
┣UCA
┣UCD
┣cldr
┣idna
┣math
┣reconstructed
┣security
┣vertical
┗zipped
ディレクトリ 1.1-Update から ディレクトリ 7.0.0 は過去・現在のデータが入っているようです。
7.0.0は現在まだ少ししか内容がありませんが、今後7.0.0以降を含めて追加されると思われます。
Unicodeバージョン は下記参照
ディレクトリ MAPPINGS は「対応」で変換テーブルなどがあります。
サブディレクトリ
EASTASIA 東アジア ETSI ヨーロッパ ISO8859 各国 OBUSOLUTE 廃止予定 VENDORS ベンダー独自
ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP932.TXT マイクロソフトの独自コード
ディレクトリ PROGRAMS はC/C++やJavaなどのプログラムやヘッダファイルがあります。
ディレクトリ UCA は Unicode照合アルゴリズム(Unicode collation algorithm)関係の資料です。
◆ wikipedia UCA
ディレクトリ UCD は Unicode Character Database関係の資料です。
Unicode Character Setのコードに文字を割り当てた表。
ブロック分け資料は ◆こちらです。
ftp://ftp.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt は漢字ハングル以外の文字詳細
ftp://ftp.unicode.org/Public/UCD/latest/ucd/HangulSyllableType.txt ハングルの文字詳細
ftp://ftp.unicode.org/Public/UCD/latest/ucd/unihan.zip 漢字の文字詳細
http://www.unicode.org/reports/tr44/ 上記の解説
http://www.unicode.org/charts/unihan.html 漢字データベース 漢字を入れて検索
同ページの Unihan Radical-stroke Index は部首索引
unihan.zip の詳細
Unihan_DictionaryIndices.txt 出典となる字典 kMorohashi 諸橋大漢和 kIRGKangXi 康熙字典
http://www.kangxizidian.com/ 康熙字典
Unihan_DictionaryLikeData.txt その他資料
Unihan_IRGSources.txt 元になる規格 kIRG_JSource 日本 G中国 T台湾
Unihan_NumericValues.txt 数字を表す漢字
Unihan_OtherMappings.txt 他の規格との対応表
Unihan_RadicalStrokeCounts.txt 部首索引の画数
Unihan_Readings.txt 各国の読み方
Unihan_Variants.txt 異字体情報
ディレクトリ cldrは 共通ロケールデータリポジトリ関係の資料です。
◆ http://ja.wikipedia.org/wiki/Common_Locale_Data_Repository
ディレクトリ idna はAscii文字以外の文字によるドメイン名に関する資料です。
ディレクトリ math は数学用の記号等の資料です。
ディレクトリ reconstructed 「再構築された」ですのでラウンドトリップ変換に関する資料か
ディレクトリ security このディレクトリにはUnicodeのセキュリティメカニズムの資料があります。偽キリル文字などによるフィッシング詐欺防止資料等と思われます。例「уahoo.com」
ディレクトリ vertical 縦書きテキストレイアウトの資料があります。日本語関連では縦長音や縦括弧があります。
ディレクトリ zipped 各バージョンの最終的なデータファイルのzip圧縮バージョンが含まれています。
--------------------------------------------------------------------------------
年月日 Unicodeバージョン 概要
1991年10月 1.0.0 初期バージョン 日本語は X 0201
1992年6月 1.0.1 CJK統合漢字を導入 JIS X 0208、JIS X 0212
1993年6月 1.1 ISO/IEC 10646-1:1993にあわせ変更
1996年7月 2.0 ハングルの大移動、サロゲートペアを導入
1998年5月 2.1 ユーロ記号と正誤表を追加
1999年9月 3.0 JIS X 0213の一部追加
2001年3月 3.1 JIS X 0213の一部
2002年3月 3.2 JIS X 0213(正式対応)
2003年4月 4.0 ISO/IEC 10646:2003に対応
2005年3月 4.1 ISO/IEC 10646:2003の追補Amd.1に対応
2006年7月 5.0 ISO/IEC 10646:2003の追補Amd.2とシンド語に対応
2008年4月 5.1.0 異体字セレクタを漢字に対して使い始める
2009年10月 5.2 ISO/IEC 10646:2003の追補Amd.6までに対応 ARIB外字
2010年10月 6.0 ISO/IEC 10646:2010 携帯電話の絵文字
2012年1月 6.1 ISO/IEC 10646:2012
2012年9月 6.2 新トルコリラの通貨記号の追加など
--------------------------------------------------------------------------------
ベンダ依存のコードページ
MICROSOFT
CP437 MS-DOS 米国
CP708 アラビア語(ASMO 708)
CP709 アラビア語(ASMO 449+, BCON V4)
CP710 アラビア語(Transparent Arabic)
CP720 アラビア語(Transparent ASMO)
CP737 ギリシャ語(旧 437G)
CP775 バルト語
CP850 MS-DOS 多言語(ラテン I)
CP852 MS-DOS スラブ語(ラテン II)
CP855 IBMキリル語(主にロシア語)
CP857 IBMトルコ語
CP860 MS-DOSポルトガル語
CP861 MS-DOSアイスランド語
CP862 ヘブライ語
CP863 MS-DOSカナダ系フランス語
CP864 アラビア語
CP865 MS-DOS北欧語
CP866 MS-DOSロシア語(旧ソビエト連邦)
CP869 IBM現代ギリシャ語
CP874 タイ語
CP932 日本語
CP936 中国語(中国、シンガポール)
CP949 韓国語
CP950 中国語(台湾、香港)
CP1361 韓国語(Johab)
CP1200 Unicode (ISO 10646のBMP)
CP1250 Windows 3.1 東ヨーロッパ
CP1251 Windows 3.1 キリル
CP1252 Windows 3.1 ラテン I (米国、西ヨーロッパ)
CP1253 Windows 3.1 ギリシャ
CP1254 Windows 3.1 トルコ
CP1255 ヘブライ語
CP1256 アラビア語
CP1257 バルト語
★index △TOP