terraの開発ノート ftp.unicode.org    ★index ▲戻る

以下はunicode.org のftpのページ のイメージです。 ◆リンク   ◆ミラーサイト ftp://ftp.unicode.org/Public/

FTP ディレクトリ /Public/ / ftp.unicode.org
エクスプローラーでこの FTP サイトを表示するには、Alt キーを押して、表示 をクリックして、エクスプローラーで FTP サイトを開く をクリックしてください。
--------------------------------------------------------------------------------
1 階層上のディレクトリへ

12/16/2009 12:00午前      ディレクトリ 1.1-Update
03/24/2005 12:00午前      ディレクトリ 2.0-Update
02/27/2001 12:00午前      ディレクトリ 2.1-Update
02/27/2001 12:00午前      ディレクトリ 2.1-Update2
02/27/2001 12:00午前      ディレクトリ 2.1-Update3
02/27/2001 12:00午前      ディレクトリ 2.1-Update4
03/24/2005 12:00午前      ディレクトリ 3.0-Update
02/27/2001 12:00午前      ディレクトリ 3.0-Update1
03/24/2005 12:00午前      ディレクトリ 3.1-Update
08/14/2001 12:00午前      ディレクトリ 3.1-Update1
03/24/2005 12:00午前      ディレクトリ 3.2-Update
03/24/2005 12:00午前      ディレクトリ 4.0-Update
03/30/2004 12:00午前      ディレクトリ 4.0-Update1
04/01/2005 12:00午前      ディレクトリ 4.1.0
07/15/2006 12:00午前      ディレクトリ 5.0.0
04/04/2008 12:00午前      ディレクトリ 5.1.0
09/30/2009 12:00午前      ディレクトリ 5.2.0
10/11/2010 12:00午前      ディレクトリ 6.0.0
05/17/2012 12:00午前      ディレクトリ 6.1.0
09/24/2012 12:00午前      ディレクトリ 6.2.0
05/14/2013 11:23午後      ディレクトリ 6.3.0
06/20/2013 09:36午後      ディレクトリ 7.0.0
11/19/2003 12:00午前      ディレクトリ MAPPINGS
11/12/2009 12:00午前      ディレクトリ PROGRAMS
11/01/2001 12:00午前            797 ReadMe.txt
11/27/2012 12:00午前      ディレクトリ UCA
05/31/2013 07:39午後      ディレクトリ UCD
09/26/2012 12:00午前              9 UNIDATA
05/14/2013 07:06午後      ディレクトリ cldr
09/26/2012 12:00午前      ディレクトリ idna
11/10/2011 12:00午前      ディレクトリ math
10/27/2004 12:00午前      ディレクトリ reconstructed
07/23/2012 12:00午前      ディレクトリ security
05/29/2013 05:37午後      ディレクトリ vertical
09/24/2012 12:00午前      ディレクトリ zipped

--------------------------------------------------------------------------------
上記のツリー構造(全体構造とmappingsの詳細)

┳┳歴史的バージョン
┃┣1.1-update
┃┣2.0-update
┃┣2.1-update
┃┣2.1-update2
┃┣2.1-update3
┃┣2.1-update4
┃┣3.0-update
┃┣3.0-update1
┃┣3.1-update
┃┣3.1-update1
┃┣3.2-update
┃┣4.0-update
┃┣4.0-update1
┃┣4.1.0
┃┣5.0.0
┃┣5.1.0
┃┣5.2.0
┃┣6.1.0
┃┣6.2.0
┃┣6.3.0
┃┗7.0.0
┃
┣Mappings
┃┣EASTASIA
┃┣ESTI - GSM0338.TXT
┃┣ISO8859
┃┃┣ 8859-1.TXT ~8859-16.TXT
┃┃┗DatedVersions - 上記の歴史的バージョン
┃┣OBSOLETE(廃止予定)
┃┃┣EASTASIA
┃┃┃┣JIS JIS0201,0208,0212,SHUFTJIS.TXT
┃┃┃┣KSC 韓国関係
┃┃┃┣OTHERS BIG5.TXT,CNS11643.TXT 台湾関係
┃┃┃┗TCVN ベトナム関係
┃┃┗UNI2SGML.TXT SGML化資料か
┃┗VENDORS
┃ ┣ADOBE アドビ社資料
┃ ┣APPLE  各国データからの移行資料あり
┃ ┣IBM  IBM社とのリンクのみ
┃ ┣MICSFT マイクロソフト社
┃ ┃┣EBCDIC
┃ ┃┣MAC
┃ ┃┣PC
┃ ┃┣WINDOWS
┃ ┃┗WindowsBestFit
┃ ┣MISC
┃ ┗NEXT
┣PROGRAMS
┣UCA
┣UCD
┣cldr
┣idna
┣math
┣reconstructed
┣security
┣vertical
┗zipped


ディレクトリ 1.1-Update から ディレクトリ 7.0.0 は過去・現在のデータが入っているようです。
7.0.0は現在まだ少ししか内容がありませんが、今後7.0.0以降を含めて追加されると思われます。
Unicodeバージョン は下記参照

ディレクトリ MAPPINGS は「対応」で変換テーブルなどがあります。
 サブディレクトリ
  EASTASIA 東アジア ETSI ヨーロッパ ISO8859 各国 OBUSOLUTE 廃止予定 VENDORS ベンダー独自
   ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP932.TXT マイクロソフトの独自コード

ディレクトリ PROGRAMS はC/C++やJavaなどのプログラムやヘッダファイルがあります。
ディレクトリ UCA は Unicode照合アルゴリズム(Unicode collation algorithm)関係の資料です。 ◆ wikipedia UCA
ディレクトリ UCD は Unicode Character Database関係の資料です。
Unicode Character Setのコードに文字を割り当てた表。 ブロック分け資料は ◆こちらです。
ftp://ftp.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt は漢字ハングル以外の文字詳細
ftp://ftp.unicode.org/Public/UCD/latest/ucd/HangulSyllableType.txt ハングルの文字詳細
ftp://ftp.unicode.org/Public/UCD/latest/ucd/unihan.zip 漢字の文字詳細
http://www.unicode.org/reports/tr44/ 上記の解説
http://www.unicode.org/charts/unihan.html 漢字データベース 漢字を入れて検索
同ページの Unihan Radical-stroke Index は部首索引
unihan.zip の詳細
 Unihan_DictionaryIndices.txt 出典となる字典 kMorohashi 諸橋大漢和 kIRGKangXi 康熙字典
   http://www.kangxizidian.com/ 康熙字典
 Unihan_DictionaryLikeData.txt その他資料
 Unihan_IRGSources.txt 元になる規格 kIRG_JSource 日本 G中国 T台湾 
 Unihan_NumericValues.txt 数字を表す漢字
 Unihan_OtherMappings.txt 他の規格との対応表
 Unihan_RadicalStrokeCounts.txt 部首索引の画数
 Unihan_Readings.txt 各国の読み方
 Unihan_Variants.txt 異字体情報
ディレクトリ cldrは 共通ロケールデータリポジトリ関係の資料です。
◆ http://ja.wikipedia.org/wiki/Common_Locale_Data_Repository
ディレクトリ idna はAscii文字以外の文字によるドメイン名に関する資料です。
ディレクトリ math は数学用の記号等の資料です。
ディレクトリ reconstructed 「再構築された」ですのでラウンドトリップ変換に関する資料か
ディレクトリ security このディレクトリにはUnicodeのセキュリティメカニズムの資料があります。偽キリル文字などによるフィッシング詐欺防止資料等と思われます。例「уahoo.com」
ディレクトリ vertical 縦書きテキストレイアウトの資料があります。日本語関連では縦長音や縦括弧があります。
ディレクトリ zipped 各バージョンの最終的なデータファイルのzip圧縮バージョンが含まれています。
--------------------------------------------------------------------------------
年月日  Unicodeバージョン 概要
1991年10月  1.0.0 初期バージョン 日本語は X 0201  
1992年6月  1.0.1 CJK統合漢字を導入 JIS X 0208、JIS X 0212  
1993年6月  1.1  ISO/IEC 10646-1:1993にあわせ変更    
1996年7月  2.0  ハングルの大移動、サロゲートペアを導入
1998年5月  2.1  ユーロ記号と正誤表を追加    
1999年9月  3.0  JIS X 0213の一部追加 
2001年3月  3.1  JIS X 0213の一部
2002年3月  3.2  JIS X 0213(正式対応)  
2003年4月  4.0  ISO/IEC 10646:2003に対応    
2005年3月  4.1  ISO/IEC 10646:2003の追補Amd.1に対応    
2006年7月  5.0  ISO/IEC 10646:2003の追補Amd.2とシンド語に対応
2008年4月  5.1.0 異体字セレクタを漢字に対して使い始める 
2009年10月  5.2  ISO/IEC 10646:2003の追補Amd.6までに対応 ARIB外字  
2010年10月  6.0  ISO/IEC 10646:2010  携帯電話の絵文字  
2012年1月  6.1  ISO/IEC 10646:2012    
2012年9月  6.2  新トルコリラの通貨記号の追加など    

--------------------------------------------------------------------------------

ベンダ依存のコードページ
 MICROSOFT
 CP437 MS-DOS 米国
 CP708 アラビア語(ASMO 708)
 CP709 アラビア語(ASMO 449+, BCON V4)
 CP710 アラビア語(Transparent Arabic)
 CP720 アラビア語(Transparent ASMO)
 CP737 ギリシャ語(旧 437G)
 CP775 バルト語
 CP850 MS-DOS 多言語(ラテン I)
 CP852 MS-DOS スラブ語(ラテン II)
 CP855 IBMキリル語(主にロシア語)
 CP857 IBMトルコ語
 CP860 MS-DOSポルトガル語
 CP861 MS-DOSアイスランド語
 CP862 ヘブライ語
 CP863 MS-DOSカナダ系フランス語
 CP864 アラビア語
 CP865 MS-DOS北欧語
 CP866 MS-DOSロシア語(旧ソビエト連邦)
 CP869 IBM現代ギリシャ語
 CP874 タイ語
 CP932 日本語
 CP936 中国語(中国、シンガポール)
 CP949 韓国語
 CP950 中国語(台湾、香港)
 CP1361 韓国語(Johab)
 CP1200 Unicode (ISO 10646のBMP)
 CP1250 Windows 3.1 東ヨーロッパ
 CP1251 Windows 3.1 キリル
 CP1252 Windows 3.1 ラテン I (米国、西ヨーロッパ)
 CP1253 Windows 3.1 ギリシャ
 CP1254 Windows 3.1 トルコ
 CP1255 ヘブライ語
 CP1256 アラビア語
 CP1257 バルト語

★index  △TOP
inserted by FC2 system