作者KSfish (牧场里的蠢牛)
看板share
标题[软体] ConvertZ ver 8.02 中文内码转换器
时间Sun Jun 12 08:18:05 2005
由於历史、地区原因,有时一种文字会出现多种编码方案,特别是汉字。如果文字编码跟
系统预设编码不同,则文字不能正确地列印及显示,须要进行编码转换才能变成可以辨识
的字符。
ANSI码是单一字节(8-bit)的编码集,最多只能表示256个字符,不能表示众多的汉字字
符,各个国家和地区在ANSI码的基础上又设计了各种不同的汉字编码集(例如:Big5,
GBK),使之能够处理大数量的汉字字符。这些编码使用单字节来表示ANSI的英文字符(
即兼容ANSI码),使用双字节(16-bit)来表示汉字字符。由於一个系统中只能有一种汉字
内码,造成了交流的不便。新的作业平台(ie. WinNT/2000/XP)已全面支援Unicode编码,
目前支援Unicode的程式不多,一般程式只支援ANSI字符。
GB码:GB码是1980年国家公布的简体汉字编码方案,在大陆、新加坡得到广泛的使用,也
称国标码。国标码对6763个汉字集进行了编码,涵盖了大多数正在使用的汉字。
GBK码:GBK码是GB码的扩展字符编码,对多达2万多的简繁汉字进行了编码,向下与GB码
兼容,简体版Windows是使用GBK作系统内码。
BIG5码:BIG5码是针对繁体汉字的汉字编码,目前在台湾、香港的电脑系统中得到普遍应
用,繁体版Windows是用Big5作系统内码。
Unicode码:Unicode码是最新的国际标准编码,采用二个字节 (16-bit) 编码,收入了几
乎所有国家的文字符号,适用於所有语言的作业平台,但与ANSI码不兼容,只应用於支援
Unicode的程式。Unicode Little Endian普遍用於x86系统(ie. Intel),而 Unicode
Big Endian 普遍用於RISC 系统 (ie. Alpha, Mac)。
UTF-8: Unicode 的变体,用 8-bit 编码,每个字符由一至四个字节组成。
HZ码:HZ是GB码的变体,只用每个字节的首7-bit作编码(即ANSI的首128个字符),常用
於网络资料传送。
JIS: 日文编码,即ISO-2022-JP,只用每个字节的首7-bit作编码,常用於网络资料传送
。
Shift-JIS: Microsoft制订的日文编码标准,适用於Windows日文平台。
EUC-JP: 常用於日文Unix平台,日文的PHP及MySQL多用这种编码编写。
ConvertZ 是一个中文内码转换器,让您能轻松地对纯文字档案或剪贴簿内容在
big5/gbk/unicode/utf-8/jis/shift-jis/euc-jp各种内码之间自由转换,解决不同地区
因为应用不同编码而产生的沟通问题。
功能:
提供繁/简体中文及英文介面,适用於繁/简体或其它版本的视窗。
支援 Big5/GBK/HZ/Unicode/UTF-8档案在上述各种内码间自由转换。
可预览转换前/後的文章内容和结果。
支援剪贴簿内码转换,可於程式主视窗、工具列图示的右按选单、或用热键行使此功能。
部份简体字可同时对应数个繁体字(例如:〔干、干、乾〕〔划、划〕〔里、里〕〔发、
发〕〔郁、郁〕〔松、松〕〔余、余〕等字),程式能於转码的同时自动修正这些别字。
使用者可自行编辑程式内建的『词汇校正列表』去提高辨识率。
自动更新 HTML 档案 <Meta> 标签内的 charset 数值。
文字转换转送:可在文字输入方块内键入中文字,然後将转码结果输出到指定程式。
Command line 支援。
支持 CF_HTML 转换,在 Office, IE, Outlook 等文件做剪贴簿文字转码时可以保留文件
式样。
可以将统一码数字记法 (&#xxxxx;) 还原成目标编码的文字。
支持Mp3/APE/OGG 档案 ID3/APE/OGG 标签的编码转码。
作业平台:
Windows 9x/ME/NT/2000/XP/2K3
介面:
运行时程式以工具列形式显示於萤幕上方(预设为自动隐藏)。使用者亦可用滑鼠右按
Windows 工具栏内的小图示在功能表中行使各种指令。
安装:
无须安装,只要将所有档案解压到新资料夹,然後直接执行 convertz.exe。
(档案大小:773KB)
档案下载:
http://alf-li.pcdiscuss.com/files/convertz802.zip
注意事项:
ConvertZ 用 Windows 内建 API 进行 Unicode 内码转换,系统必须同时安装有繁体及简
体支援方可正常运作。
ConvertZ 於启动时会侦查系统,若发现缺少上述任何一项会作出提示。
Win9x 使用者可以到 Windows Update下载、或安装 Ms Office 时选择加入有关元件。
Win2000/XP 使用者可在“控制台/国别设定”加入有关的文字支援。
在 Win9x/ME繁体视窗下预览 Unicode 文章时简体字会变成 ? 符号,这是因为程式所用
的 memo 元件在繁体视窗下无法显示简体字之故,对输出结果并无影响。Win2000/XP 并
无这问题。
剪贴簿统一码繁简转换的应用:
在繁体 Windows 下,如何在简体网页贴文?
先用繁体输入法在简体网页打好文字,剪入剪贴簿,选择 ConvertZ 主工具列上「剪贴簿
统一码:繁转简」功能,再贴回原处便可。
当复制简体网页的内容到剪贴簿及贴到其它应用程式,所有简体字变成问号,怎样解决?
复制後在 ConvertZ 的主工具列上选择「剪贴簿 统一码:简转繁」功能,所有剪贴簿内
的简体字会转换成繁体字,再贴到其它程式便可以。
如何将 Ms Word, Excel, Powerpoint 的简体文件转做繁体?
ConvertZ 并不能对 Ms Office 档案直接进行转换,但可以经剪贴簿转换达到同样目的。
只须用 Office 程式开启简体中文档案,将文件内容复制到剪贴簿,在ConvertZ 的主工
具列上选择「剪贴簿 统一码:简转繁」,完成後将结果贴回到原本位置便可。在“程式
设定”应须启动“CF_HTML 支援”,否则转换後除纯文字之外所有文字式样及图片等均不
会保留。
为何用ConvertZ做GB<>Big5剪贴簿转换後所有中文字变成问号?
这情况只在WinNT/2k/XP或以上版本出现,原因是系统预设的文字输入服务设定错误,当
复制的来源程式用unicode文字核心时(跟文章原本编码无关),剪贴簿文字无法转换为
正确的ANSI内码。
解决方法:复制前先将输入法状态切换成CH或任何一种中文输入法。
建议:在「控制台>地区语言选项>文字服务和输入语言>详细资料」将「预设输入语言
」更改为「中文(台湾) - 中文(繁体) - 美式键键」(简体中文Windows用家是「中文
(PRC) - 美国」),并将「英文(美国)」移除。
*注意:GBK及Big5分别占用不同内码区域,用unicode核心的程式复制对方编码的文字时
,个别中文字无法经剪贴簿获取正确的ANSI内码(例如:在繁体系统复制GBK繁体中文字
),变成问号。解决方法是改用ANSI文字核心的编辑器开启该文件去进行剪贴簿
GBK<>Big5转换。
更新纪录:
v8.02 有下列更改:
在APE v1标签各字串尾部加入终结符号 (兼容Monkey's Audio v3.97或之前版本)。
在各预览窗口补回右键功能表。
v8.01 有下列更改:
新增APE/OGG音乐标签转换(附APE/OGG标签编辑器)。
ID3v2设定为unicode编码而v2标签并不存在时,转换後会产生乱码,已修正。
可更改档案预览的长度。
数值在P以下的HTML Notation现更改为不作转换。
容许同时使用多於一个自订词汇修正表,升级用家须在程式设定自行汇入原有的
user_xxfix.dat。
在繁体Win9x/ME,现可在档案转换的预览窗口及剪贴簿检视器正常显示unicode简体字。
(* 系统需要安装有RICHED20.DLL)
UTF-8档案预设改为不加BOM到档头。
大量程式码的改写及修正。
v7.40 有下列更改:
Win9x的键盘设置并不影响剪贴簿转换,键盘设置错误的提示改为只出现在WinNT/XP。
档案转换:若某字在目标编码没有对应字,会用Html Notation替代。(只适用於Html类
型档案)
当Shift-JIS字符的首字节数值大於$EF时进行Shift-JIS<>JIS/EUC转码会出现错误,已修
正。
当ID3v2的目标编码是unicode或utf-8而档案只有ID3v1, 转换时程式会自动复制ID3v1标
签到ID3v2。
更新内码对照表及词汇修正列表。
其它一些介面上的的小更改及修正。
v7.32 有下列更改:
不少用户遇到因系统键盘设置错误而导致剪贴簿转换後出现乱码的情况,现当启动
ConvertZ时会检查当前键盘设置,如发现错误会弹出提示窗口,用户请依指示修改系统设
定。
一些介面上的小修正。
更新内码对照表及词汇修正列表。
v7.31 有下列更改:
修正gbk(asc)/big5(asc)>unicode档名转换後子资料夹名称变成乱码的问题。
v7.30 有下列更改:
在Win9x/Me下档案转换时如果档案清单超过32768个档案会导致程式错误,已修正。
如果MP3的ID3v2 header标示错误的标签大小,转码可能导致档案损坏,已加入检测程序
自动作出修正。
剪贴簿检视器的介面轻微修改。
监控ID3及档名转换窗口档案列表所在的目录,当内容更改时自时更新。
更新内码对照表及词汇修正列表。
v7.22 有下列更改:
在简体中文系统下程式介面上有几个地方出现文字乱码,已修正。
v7.21 有下列更改:
ID3转换“目录模式”预览标签时出现轻微记忆体泄漏,已修正。
修正「档案及资料夹名称转码」窗口介面上的一些错误。
补上剪贴簿GBK<>Shift-JIS转换模式。
於剪贴簿转换时自动修正因不正确键盘设置而导致的乱码。
v7.20 有下列更改:
修正QuotedPrintable解码当遇到换行符号时无法正确转换的bug。
ID3编辑器复制ID3v2标签到ID3v1时漏了曲目一栏,已修正。
档案转换窗口当来源目录和程式安装目录相同时,会无法显示档名,已修正。
个别情形下CF_HTML转换剪贴时会有文字缺失情况,已修正。
各热键组合可自行选择转换的模式。
ID3转换添加在标签文字结尾插入空白字元的选项,解决个别程式的兼容问题。
当档名或ID3转码窗口开启时,如果在My Document目录下建立新资料夹,会导致AV错误,
已修正。
ID3编辑窗口,当勾取id3v2而下面各栏目是空白的话,更新时程式会长时间停顿,已修正
。
档名/ID3转码:在档案模式时,选取目录会开启新窗口,避免跟目录模式混淆。
其它一些介面上的小更改。
仅供个人免费使用, 严禁作任何商业用途!
--
The road to hell is paved with good intentions
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 219.80.132.231