2010年02月19日

有用な2バイト系Unicode文字

有用な2バイト系Unicode文字

 日中韓のUTF8での文字コードは1文字3バイトである。一般の利用で言うと歴史的に日本語での利用文字の範囲は、一般的なASCII文字に各水準のJISコード(をShiftしたShift_JISかEUC-JPの範囲内のみの利用)が主流であり、一般的な処理系の基盤自体が、その範囲でのUnicode対応となっていることが多いので、2バイト系の文字は余り使われて来なかった。しかし、対応するWebサーバ上のものを最近のOSとブラウザで利用するのであれば、そのかなりのものが有効な利用出来るのが現実だ。もし、下記の一覧で表示されないものがあれば、このプロクか貴方のOSブラウザの対応が充分ではないということになる。
 当方が利用しているZope-2.12.2上のZWiki2b1とVista+Firefox3.5では、ここで掲載の文字全てが利用出来るので、以下に、利用価値のあるものを目的別に整理し掲載して試た。
 因みに、Vistaのメモ帳では「リサイクル」「制御文字」の全て、「進行」の後半、「矢印」「生活」の一部は、下駄を履いてしまう。恐らくFont対応の問題なのだろう。また当方が日頃愛用しているMKEditor等の一般的な日本語エディタでは内部コードをShift_JISとしている為、変換不能なものがほとんどでほぼ全滅である。この様にインフラ面で利用に制限はあるものの、今後は、「𠮷」等のCJK拡張文字と共に数年内に当り前の存在になるだろう。その為にも当方では、この一覧を活用し積極的に運用し不具合を明らかにして試ようと思う。因みに、無償での利用なので文句は言えないが、ここ「SeeSaaブログ」も何処かで利用コードに制約が加わっている様で、ほぼ全滅であるので、以下の通り表示されないことを確認頂いた上で、ファイル掲載して置くので、添付ファイル側の「有用な2バイト系Unicode文字」を閲覧頂きたい

目的別

連番向け英数(等幅)

括弧付数字:⑴⑵⑶⑷⑸⑹⑺⑻⑼⑽⑾⑿⒀⒁⒂⒃⒄⒅⒆⒇
ピリオド付数字:⒈⒉⒊⒋⒌⒍⒎⒏⒐⒑⒒⒓⒔⒕⒖⒗⒘⒙⒚⒛
2重丸数字:⓵⓶⓷⓸⓹⓺⓻⓼⓽⓾
丸数字 0:➀➁➂➃➄➅➆➇➈➉ ⓪
黒丸数字:❶❷❸❹❺❻❼❽❾❿
黒丸数字太:➊➋➌➍➎➏➐➑➒➓
黒丸数字11-20 0:⓫⓬⓭⓮⓯⓰⓱⓲⓳⓴⓿
括弧付英字:⒜⒝⒞⒟⒠⒡⒢⒣⒤⒥⒦⒧⒨⒩⒪⒫⒬⒭⒮⒯⒰⒱⒲⒳⒴⒵
丸英字:  ⒶⒷⒸⒹⒺⒻⒼⒽⒾⒿⓀⓁⓂⓃⓄⓅⓆⓇⓈⓉⓊⓋⓌⓍⓎⓏ
丸英字:ⓐⓑⓒⓓⓔⓕⓖⓗⓘⓙⓚⓛⓜⓝⓞⓟⓠⓡⓢⓣⓤⓥⓦⓧⓨⓩ

半角全角系英数仮名

数字:0123456789
英字:ABCDEFGHIJKLMNOPQRSTUVWXYZ
英字:abcdefghijklmnopqrstuvwxyz []\/
半角カナ:アイウエオ カキクケコ サシスセソ タチツテト ナニヌネノ
半角カナ:ハヒフヘホ マミムメモ ヤユヨ ラリルレロ ワン ゙゚ー ヲ
半角カナ:ァィゥェォ ャュョ ッ 。、・「」 ¥₩¢£

記号類

通貨記号:₠₡₢₣₤₥₦₧₧₩₪₫€₭₮₯₰₱₲₳₴₵
リサイクル:♲♳♴♵♶♷♸♹♺♻♼♽
生活:☕♨♿☎☏⚱ ☀☁☂☃☔ ✆✉✈
メモ:✍✎✏✐✑✒
道具:✁✂✃✄
チェック:☐☑☒☓ ✓✔✕✖✗✘
十字:✙✚✛✜✝✞✟✠ ✢✣✤✥✦✧
星型:✩✪✫✬✭✮✯✰ ✴✵✶✷✸✹
花型:✱✲✳ ✺✻✼✽✾✿❀❁❂❃ ❖
雪結晶:❄❅❆❇❈❉❊❋
網掛け:▤▥▦▧▨▩ ◍
割合:⅟⅛⅜⅝⅞⅙⅓⅔⅚⅕⅖⅗⅘
進行:◔◑◕◐◑◒◓◖◗◠◡◜◝◞◟ ◴◵◶◷ ◰◱◲◳ ◸◹◺◿
3D:❍❏❐❑❒
標識:☠☢⚠⚡
制御文字:␀␁␂␃␄␅␆␇␈␉␊␋␌␍␎␏␐ ␑␒␓␔␕␖␗␘␙␚␛␜␝␞␟␠␡␣
ボタン表示:▶▷▸▹►▻ ◀◁◂◃◄◅ ◉ ⟲⟳ ⏎⏏
矢印:⤆⤇⤊⤋⤴⤵⥀⥁ ➔➘➙➚ ➜➝➞➟➠➡➢➣➤➥➦➧➨ ➩➪➫➬➭➮➯➱➲ ➳➴➵➶➷➸➹➺➻➼➽➾ ⬀⬁⬂⬃⬄⬅⬆⬇⬈⬉⬊⬋⬌⬍⬎⬏⬐⬑ ☇☈ ☚☛☜☝☞☟ ⟰⟱⟴⟵⟶⟷⟸⟹⟺⟻⟼⟽⟾⟿
略号:℀℁⅍℅℆℃℉g℻℠™


続きを読む
タグ:Unicode
posted by Mire at 17:11 | Comment(0) | TrackBack(0) | 標準化推進 | このブログの読者になる | 更新情報をチェックする

2009年08月28日

TSV Tab-Separated Values MIME type: text/tab-separated利用

 少し、システムやPCに詳しい方ならば、異種システム間でのデータ交換を目的とするカンマ区切のテキストファイルで「〜.CSV」というものをご覧になったり利用したことがあるかと思う。CSVは定番の一つと言えばその通りなのだが、データ自体にカンマ「,」を含むとトラブルので、予めそれを含まない様にするとか、派生の規約として文字列は全て引用符で括り、その中のカンマ「,」を区切り文字として認識させない様にシステムの送受信側双方で手を入れるという面倒な作業が必要になる。

 一般にはそれが嫌なので一対一のシステムの場合には、データ行をスペースで埋めて各列の値を固定長となる様にした固定長ファイルにしたり、その場合のスキーマ定義を表すファイルを別に準備し渡したりと、まあ、結構場当たり的に色々とバリエーションがある。当方の場合、過去、カンマ区切だけどスペースで各列の文字数を揃え固定長にもして、どちらでも利用可能なものを交換用に用いたこともあったくらいだ。まあこれは、どっちでもいいから読んでくれという投槍形式ととでも名付けようか^^;;

 さて、さて、そろそろ本論。この様に悩ましいテキストファイルによるデータ交換で、比較的無手順で簡易に行えるものとしてCSVのカンマ「,」の代わりにタブを区切文字に使う場合があるのをご存じだろうか。何のことか思う方でも、ExcelやOpenOfficeのCalcでテキストデータを読込もうとすると区切り文字を選択するダイアログが開いて「タブ」を選択可能になることから「あれか」と思い出す方はそこそこいらっしゃるのではないだろうか。

 タブ区切の場合、CSV同様にデータ自体にタブ文字を含むと同様にうまくデータ交換出来なくなるのは当然だが、カンマ「,」より交換データ内の出現率が少ないのが利点である。そこで当方がこれを知ってからはほとんどこのタブ区切りを使って来た。でも、そのファイルの拡張子はTXTやCSVまたその時の気分でTABと統一しないで適当に決めていた。これじゃあんまりよ想いつつも放置していたら、先日ひょんなことで、偶然「TSV」という拡張子を目にすることになった。

 今回、その思いを現実にする為、グーグルして見ると、記述は少ないものの、TSV自体のMIME typeがきちんと決められていることが判ったので、当方の DVD_Label.py の吐くテキストファイルの拡張子を早速 TSV とした。小さな一歩だが、こんなとこから、TSV という MIME typeの社会的認知を広めて行けたらと思う。さあ、流行れ! 流行れ!

TSV Tab-Separated Values MIME type: text/tab-separated
続きを読む
タグ:TSV MIME type Python
posted by Mire at 00:50 | Comment(0) | 標準化推進 | このブログの読者になる | 更新情報をチェックする
月額見放題1,000円開始キャンペーンバナー(画像ありver)
紺碧の艦隊 ルパン三世 GREAT CHASE クリックプロモーション
<< 2013年01月 >>
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    
カテゴリ
タグクラウド
ファン
利用中のオープンソース
最近のコメント
最近の記事
過去ログ
QRコード
レガシーなアプリはいかが?
Dell 法人のお客様ページ
  • 【法人様向け】デル、お得なキャンペーン情報
  • 法人のお客様向け ストレージソリューション
  • 法人のお客様向け ネットワークソリューション
  • 【SOHO法人様向け】デル・オンライン広告限定ページ
  • デル-個人のお客様ページ
  • 【個人のお客様向け】デル・オンライン広告限定ページ
  • オンライン広告限定キャンペーンページ
  • ソフトウェア&周辺機器 パソコン工房
    ツートップインターネットショップ(twotop.co.jp) マウスコンピューター/G-Tune
  • ×

    この広告は1年以上新しい記事の投稿がないブログに表示されております。