[Blog_users_ml 863] MacOS X apache+MTで文字化け

KYUSHIMA Masahiro blog_users_ml@dropcontrol.com
Sun, 15 Feb 2004 07:07:09 +0900


sheemer@沖縄です。MT作業環境下の文字化けについて意見をお聞かせください。

http://www.ryukyu.ne.jp/~sheemer/index.html

にあるページをMovableTypeで作っています。以前に少し書いたことがあるのですが;

・MacOS X上のノートPCでapache+MovableTypeを稼働
・そのlocalhost上のMTにログインしてコンテンツ作成
・そのlocalhost上にできるblogに対し、wgetでアクセスし、コンテンツを再度全部
 静的コンテンツとして同一ノートPC上にget。リンクの一部をawk scriptで書き換え
・でき上がったワンセットの静的コンテンツをftpでプロバイダへmirror

という作業を行っています。

以前は統全てlinuxノートPCで行っていましたが、最近PCの買い換えでPowerBookG4で
動かしています。その頃より、ときどきページの文字化けを指摘されるようになりました。
ブラウザのバージョンなどによって異なりますが、古めのNetScapeやiCabでよく化ける
用です。

化けているファイルの情報を見ると;

$ file index.html
index.html: ISO-8859 English text, with very long lines

と見えます。以前の化けないファイルは;

$ file old/index.html 
old/index.html: ASCII English text, with very long lines, with escape sequences

などと見えます。コンテンツの作成は、default-encodingを;

(set-language-environment 'Japanese)
(set-default-coding-systems 'euc-jp-unix)
(set-terminal-coding-system 'euc-jp-unix)
(set-keyboard-coding-system 'sjis-mac)
(set-clipboard-coding-system 'sjis-mac)
(set-file-name-coding-system 'utf-8)

などと設定したemacsで事前に書いてあるメモ書きから、コピーして、MovableTypeの
「エントリーの内容(body)」にペーストし、さらに編集しています。タイトルは
大体この時に手入力しています。mt.cfgでは「PublishCharset EUC_JP」になって
います。

・コピー・ペースとのときなどにエンコーディングが変わって文字化けしたり
 しているのでしょうか。
・それとも、他の原因によるのでしょうか。
・どのような対応策が考えられるでしょうか。

ご意見をお聞かせください。
-- 
KYUSHIMA Masahiro, MD
Division of Cardiology, 
Chief, Division of Medical Informatics,
Okinawa Chubu Hospital, Okinawa, Japan. +81-98-875-6743(fax)
http://www.ryukyu.ne.jp/~sheemer/