2008年06月22日

iconvはCとの通信で動くのか

ErlangとPerlの速度比較(みかログ)
によると、

Cのモジュールと通信してデータをやりとりする仕様だけれど, C側のモジュールがシングルスレッドで実行されて,そのモジュールとの通信を奪い合うのが原因?なのかなぁ.


だそうだ。とはいえ、今のところそんなにスピードは求めないからiconvでも十分かな。
posted by へろ at 23:42| Comment(1) | TrackBack(0) | Erlang

あやうく車輪を再発明するところ

Erlangでのコード種別変換、あやうく車輪を再発明するところでしたわ。

CEAN(http://cean.process-one.net/)にiconvというのが上がってて、これをつかえばいいらしい。

そうだよなあ。
posted by へろ at 23:24| Comment(0) | TrackBack(0) | Erlang

Erlangで日本語(コード体系判別 EUC/SJIS)

とりあえずErlangをいろいろいじり始めたけど、日本語対応がまったくない(バイトコードを自分で扱え)ということで、1980年代末期のC言語のよう。

というわけで、ひとまず勉強がてら日本語処理関連のユーティリティコードを書き始めることに。

UTF-8というかUnicodeの扱いが問題なんだよなぁ。。。
※みての通りコード推定が雑なので、実用にはまだまだ使えません、念のため↓

-module(jcode).
-export([check/1]).

is_euc({codepair, C1, C2}) ->
( (C1 >= 16#a1) and (C1 =< 16#fe))
andalso( (C2 >= 16#a1) and (C2 =< 16#fe)).

is_sjis({codepair, C1, C2}) ->
(((C1 >= 16#81) and (C1 =< 16#9F))
orelse ((C1 >= 16#E0) and (C1 =< 16#FE)))
andalso( ((C2 >= 16#40) and (C2 =< 16#7e))
orelse ((C2 >= 16#80) and (C2 =< 16#fc))).

check_pair([A, B | T]) ->
CodeE = is_euc({codepair, A, B}),
CodeS = is_sjis({codepair, A, B}),
if
CodeE == true -> {ok, euc, T} ;
CodeS == true -> {ok, sjis, T} ;
true -> check_pair([B] ++ T)
end;
check_pair([A|T]) -> {ok, ascii, [] };
check_pair([]) -> { ok, ascii, [] }.

check(Source) ->
check_pair(Source).



■補足
Erlangでのコード種別変換、あやうく車輪を再発明するところでしたわ。 → http://blog.dressingroom.jp/article/16282486.html

iconvはCとの通信で動くのか → http://blog.dressingroom.jp/article/16282967.html
posted by へろ at 19:40| Comment(344) | TrackBack(0) | Erlang