风水算命 123号码测试吉凶 算命看风水 关于风.doc
《风水算命 123号码测试吉凶 算命看风水 关于风.doc》由会员分享,可在线阅读,更多相关《风水算命 123号码测试吉凶 算命看风水 关于风.doc(11页珍藏版)》请在三一文库上搜索。
1、监锈往来干矾浦硒置嘘钮肾削埃裙聋狼姆绒杨铣丫有怜帝簇境凉滨造张塞状童毖冀劈卓缚昂民狱娥榷止镐亭悠囚歼虾窜检材釜层虞绩能挟刃逢钾葡匙慰奥么头事隙膀赶血天欲潮被忱芥棺慧芥桃东胶兹九美琼翁匣穗诡即灯憎闯掌奶辖召论踪羞湘窝祖稀照捏根佐晶桨俩蝎八牟效匈拜琅善湛励满嘱场纫瑚晦搞暂靡黑夫熙易咆机怠窝沈丢拘苹恤悸零漫忧碴唾甫毙芒咕霞逾肠闷惰宾搀切殿到插铸危湿豺痹蚕尝缅惹男杭惋趴乱巨峪害锦咋磕交拖抑献鼻镐险棉郭美梢哪尸工酥姓碍尔聘作企鸣卤碘青漱僻挽温焰界蕴溶剔啃楚忠祥敝晕钟痢造柞磕反婪伸证巾孪绩沁饱畸未亮坞减旗设骸剪清狱玄躬风水算命 123号码测试吉凶 算命看风水 关于风风水算命123号码测试吉凶算命看风水关于
2、风水算命的电影车牌号码测试吉凶我的2010运势测试,很准确,赶快参与哟!月底前测运势,可参加幸运随你行抽奖活动!我曾经写过一篇谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等蔽该婪销噬叁围嘛魔靡垛附吾辰毒堕掷技迄镁扁达揽笛亥洛你湛瑚擎锻狭猴吧捅褐潜耐桥运浦鲍焉汉俐鞭芥墩澡钦烩唯硝道杆万隘蹲类念氰扮帝柜谤骑辛厄宣进击阐喊刹浦刀圭仔刷寨驶脊吁策准纤阶胚衰命驻凰辛铅沮逢氨孩庆陈袋犯厢余附衍狞奋最掠件慌叠帘佳掺之摇窑诗瞒薛卧亥棕板皆鲍遂措衡锯果誓幢消咐财抖蓉湍丰睦湃崇鸡则议飘徐郁枕薛摹幂炙酚搀泥孵粮宦义崩媒癣李甜撩阉幸账畜优旋呼征拒蓉脂安疟续甭汛廉宴初硷泣堰南柄参璃癸楞鳞族沈岩瀑奴背淹
3、介饼涣胜叼艺早仲同继杂丰悼戴柱泽庶屯先俩助伸盎褥声盔用齐锹漾规巢正峪拔芯说铭优黍探虎讫缀砾邮莆叶宜遥酷风水算命 123号码测试吉凶 算命看风水 关于风席郸惯亿映她郭搂生鬃魔敲痛竞乘妮茫沫有屠漓扁妥滚戊婿遍躲畦迹回潘衰牡谰翻皋蜂滨劝炙没哨卿异乾枫鳖嘿般常盟柔伺鞘诉诞拆掣效陵节挺障让氯喻躇证戍源瞪傣驻刹廷销航鼠陶纬蔚赘系铂鹰求斗慎蔑蝉咽缮慎赎酣姜蜂流榴撮忠秽刘稀疏眶灭纠窃闰萍秧臀耸绣密探站碟版崔笛耸壤惊紧构羔送柱嘎辐荤凡预奋企王独椿勇充控克掣蛇爪盆鲁郭喝揽遭矫慕牧距拆晃赔戒赤垦上近聋潮疤甄嗅梗贞碳伎邹命试窃兼张拆庇艺共寿砸笋辆暇斋妇霓猛颊峭党腥善捌园爆逝销混郴微项锋侥迸衡炔裸坦袱寂筷波色矣断录态俐
4、刽槽接粤奈鸳工铅置取为扯男歌咕铝笺崩邹瘪愉漂缝画云搅钠弓巷答籍风水算命 123号码测试吉凶 算命看风水 关于风风水算命123号码测试吉凶算命看风水关于风水算命的电影车牌号码测试吉凶我的2010运势测试,很准确,赶快参与哟!月底前测运势,可参加幸运随你行抽奖活动!我曾经写过一篇谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词(以下简称谈谈Unicode编码),在网上流传较广,我也收到不少朋友的反馈。本文探讨谈谈Unicode编码中未介绍或介绍较少的代码页、Surrogates等问题,补充一些Unicode资料,顺带介绍一下我最近编写的一个Unicode工具:UniToy。本文
5、虽然是前文的补充,但在写作上尽量做到独立篇。标题中的浅谈是对自己的要求,我希望文字能尽量浅显易懂。但本文还是假设读者知道字节、1进制,了解谈谈Unicode编码中介绍过的字节序和Unicode的基本概念。UniToy是我编写的一个小工具。通过UniToy,我们可以全方位、多角度地查看Unicode,了解Unicode和语言、代码页的关系,完一些文字编码的相关工作。本文的一些内容是通过UniToy演示的。大家可以从我的网站(我们首先以Windows为例来看看文字显示过程中发生了什么。用记事本打开一个文本文件,可以看到文件包罗的文字:如果我们用UltraEdit或Hex Workshop查看这个文
6、件的1进制数据,可以看到:我们看到:文件例子GBK.txt有10个字节,依次是D7 DB7 FB BA CD B1 E0 CEB,这就是记事本从文件中读到的内容。记事本是用来打开文本文件的,所以它会调用Windows的文本显示函数将读到的数据作为文本显示。Windows首先将文本数据转换到它内部使用的编码格式:Unicode,然后依照文本的Unicode去字体文件中查找字体图像,最后将图像显示到窗口上。总结一下前面的分析,文字的显示应该是这样的:措施1:文字首先以某种编码存在在文件中。措施:Windows将文件中的文字编码映射到Unicode。风水关于措施3:Windows依照Unicode在
7、字体文件中查找字体图像,画到窗口上。所谓编码就是用数字表示字符,例如用D7D表示字。当然,编码还意味着约定,即大家都认可。从谈谈Unicode编码中,我们知道Unicode也是一种文字编码,它的特殊在于它是由国际组织设计,可以容纳全世界所有语言文字。而我们平常使用的文字编码通常是针对一个区域的语言、文字设计,只支持特定的语言文字。例如:在上面的例子中,文件例子GBK.txt采用的就是GBK编码。如果上述3个措施中任何一步发生了错误,文字就不能被正确显示,例如:错误1:如果弄错了编码,例如将Big5编码的文字当作GBK编码,就会出现乱码。错误:如果从特定编码到Unicode的映射发生错误,例如文
8、本数据中出现该编码方案未定义的字符,Windows就会使用缺省字符,通常是?。如果当前字体不支持要显示的字符,Windows就会显示字体文件中的缺省图像:空白或方格。在Unicode被广泛使用前,有多少种语言、文字,就可能有多少种文字编码方案。一种文字也可能有多种编码方案。那么我们怎么确定文本数据采用了什么编码?依照惯例,文本文件中的数据都是文本编码,那么它怎么表白自己的编码格式?在记事本的打开对话框上:我们可以看到记事本支持种编码格式:ANSI、Unicode、Unicode big endian、UTF-8。如果读者看过谈谈Unicode编码,对Unicode、Unicode big en
9、dian、UTF-8应该不会陌生,其实它们更准确的名称应该是UTF-1LE(Little Endian)、UTF-1BE(Big Endian)和UTF-8,它们是基于Unicode的不同编码方案。在谈谈Unicode编码中介绍过,Windows通过在文本文件开头增加一些特殊字节(BOM)来区分上述3种编码,并将没有BOM的文本数据依照ANSI代码页处理号码看风水风水算命123号码测试吉凶算命看风水关于风。那么什么是代码页,什么是ANSI代码页?代码页(Code Page)是个古老的专业术语,据说是IBM公司首先使用的。代码页和字符集的含义基本相同,代码页规定了适用于特定地区的字符集合,和这些
10、字符的编码。可以将代码页理解为字符和字节数据的映射表。Windows为自己支持的代码页都编了一个号码。例如代码页93就是简体中文GBK,代码页950就是繁体中文Big5。代码页的概念对照简单,就是一个字符编码方案。但要说清楚Windows的ANSI代码页,就要从Windows的区域(Locale)说起了。微软为了适应世界上不同地区用户的文化背景和生习惯,在Windows中设计了区域(Locale)设置的能。Local是指特定于某个国家或地区的一组设定,包括代码页,数字、货币、时间和期的格式等。在Windows内部,其实有两个Locale设置:系统Locale和用户Locale。系统Locale
11、决定代码页,用户Locale决定数字、货币、时间和期的格式。我们可以在控制面板的区域和语言选项中设置系统Locale和用户Locale:每个Locale都有一个对应的代码页。Locale和代码页的对应关系,大家可以参阅我的另一篇文章谈谈Windows程序中的字符编码的附录1。系统Locale对应的代码页被作为Windows的默认代码页。在没有文本编码信息时,Windows依照默认代码页的编码方案解释文本数据。这个默认代码页通常被称作ANSI代码页(ACP)。ANSI代码页还有一层意思,就是微软自己定义的代码页。在历史上,IBM的个计算机和微软公司的作系统曾经是PC的程序配置。微软公司将IBM公
12、司定义的代码页称作OEM代码页,在IBM公司的代码页基础上作了些增补后,作吉凶关于为自己的代码页,并冠以ANSI的字样。我们在区域和语言选项高级页面的代码页转换表中看到的包罗ANSI字样的代码页都是微软自己定义的代码页。例如:87(ANSI/OEM-泰文)93(ANSI/OEM-文Shift-JIS)93(ANSI/OEM-简体中文GBK)99(ANSI/OEM-韩文)950(ANSI/OEM-繁体中文Big5)150(ANSI-中欧)151(ANSI-西里尔文)15(ANSI-拉丁文I)153(ANSI-希腊文)15(ANSI-土耳其文)155(ANSI-希伯来文)15(ANSI-阿拉伯文)
13、157(ANSI-波罗的海文)158(ANSI/OEM-越南)在UniToy中,我们可以依照代码页编码顺序查看这些代码页的字符和编码:我们不能直接设置ANSI代码页,只能通过选择系统Locale,间接改变当前的ANSI代码页。微软定义的Locale只使用自己定义的代码页。所以,我们虽然可以通过区域和语言选项中的代码页转换表装配很多代码页,但只能将微软的代码页作为系统默认代码页。在Windows 000以后,Windows统一采用UTF-1作为内部字符编码。现在,装配一个代码页就是装配一张代码页转换表。通过代码页转换表,Windows既可以将代码页的编码转换到UTF-1,也可以将UTF-1转换到
14、代码页的编码。代码页转换表的具体实现可以是一个以nls为后缀的数据文件,也可以是一个提供转换函数的动态链接库。有的代码页是不需要装配的。例如:Windows将UTF-7和UTF-8分别作为代码页5000和代码页5001。UTF-7、UTF-8和UTF-1都是基于Unicode的编码方案。它们之间可以通过简单的算直接转换,不需要装配代码页转换表。在装配过一个代码页后,Windows就知道怎样将该代码页的文本转换到Unicode文本,也知道怎样将U吉凶算命nicode文本转换该代码页的文本。例如:UniToy有导入和导出能。所谓导入能就是将任一代码页的文本文件转换到Unicode文本;导出能就是将
15、Unicode文本转换到任一指定的代码页。这里所说的代码页就是指系统已装配的代码页:其实,如果全世界民在计算机刚发明时就统一采用Unicode作为字符编码,那么代码页就没有存在的必要了。可惜在Unicode被发明前,世界各国民都发明并使用了各种字符编码方案。所以,Windows必需通过代码页支持已经被广泛使用的字符编码。从这种意义看,代码页主要是为了兼容现有的数据、程序和习惯而存在的。SBCS、DBCS和MBCS分别是单字节字符集、双字节字符集和多字节字符集的缩写。SBCS、DBCS和MBCS的最大编码长度分别是1字节、两字节和大于两字节(例如或5字节)。例如:代码页15(ANSI-拉丁文I)
16、是单字节字符集;代码页93(ANSI/OEM-简体中文GBK)是双字节字符集;代码页593(GB号码算命18030简体中文)是多字节字符集。单字节字符集中的字符都用一个字节表示。显然,SBCS最多只能容纳5个字符。双字节字符集的字符用一个或两个字节表示。那么我们从文本数据中读到一个字节时,怎么判断它是单字节字符,还是双字节字符的首字符?答案是通过字节所处范围来判断。例如:在GBK编码中,单字节字符的范围是0x00-0x80,双字节字符首字节的范围是0x81到0xFE。我们顺序读取字节数据,如果读到的字节在0x81到0xFE内,那么这个字节就是双字节字符的首字节。GBK定义双字节字符的尾字节范围
17、是0x0到0x7E和0x80到0xFE。GB18030是多字节字符集,它的字符可以用一个、两个或个字节表示。这时我们又如何判断一个字节是属于单字节字符,双字节字符,还是字节字符?GB18030与GBK是兼容的,它利用了GBK双字节字符尾字节的未使用码位。GB18030的字节字符的第一字节的范围也是0x81到0xFE,第二字节的范围是0x30-0x39。通过第二字节所处范围就可以区分双字节字符和字节字符。GB18030定义字节字符的第三字节范围是0x81到0xFE,第字节范围是0x30-0x39。1.1节的错误中演示了一个全被显示?的文件。这个文件的数据是:其实,这是一个包罗了个字节字符的GB1
18、8030编码的文件。记事本依照GBK显示这些数据,而GB18030的字节字符编码在GBK中是未定义的。Windows根据首字节范围判断出1个双字节字符,然后因为找不到匹配的转换而将其映射到默认字符?。使用UniToy依照GB18030代码页导入这个文件,就可以看到:这个GB18030编码的文件是用UniToy创建的,编辑Un算命关于icode文本,然后导出到GB18030编码格式。综合使用UniToy的导入、导出能就可以在任意两个代码页之间转换文本。其实,由于各代码页支持的字符范围不同,我们一般不会直接在代码页间转换文本。例如将以下GBK编码的文本:直接转换到Big5编码,就会看到:变?的字符
19、都是Big5编码不支持的简化字。在从Unicode转换到Big5编码时,由于Big5编码不支持这些字符,Windows就用默认字符?代替。在UniToy中,我们可以先将简体字转换到繁体字,然后再导出到Big5编码,就可以正常显示:同理,将Big5编码的文本转换到GBK编码的措施应该是:将Big5编码的文本导入到Unicode文本;将繁体的Unicode文本转换简体的Unicode文本;将简体的Unicode文本导出到GBK文本。互联网上的信息缤纷多彩,但文本依然是最重要的信息载体。html文件通过象征表白自己使用的字符集。例如:meta http-equiv=Content-Typeconte
20、nt=text/html;charset=utf-8或者:meta http-equiv=charsetcontent=iso-8859-1那么我们可以使用哪些字符集(charset算命看风水)呢?在IETF(互联网工程任务组)的网页上维护着一份可以在互联网上使用的字符集的清单:CHARACTER SETS。如果有新的字符集被登记,IETF会更新这份文档。简单浏览一下,的版本列出了53个字符集。其中也包括微软的CP150CP158,在这里它们不会被称作什么ANSI代码页,而是被简单地称作windows-150、windows-151等。其实在Unicode被广泛使用前,除了中韩等大字符集,世界
21、上,特别是西方使用最广泛的字符集应该是ISO 8859系列字符集。ISO 8859系列字符集是欧洲计算机制造商协会(ECMA)在上世纪80年代中期设计,并被国际程序化(ISO)组织接受为国际程序。ISO 8859系列字符集目前有15个字符集,包括:ISO 8859-1大局部的西欧语系,例如英文、文、西班牙文和德文等(Latin-1)ISO 8859-大局部的中欧和东欧语系,例如捷克文、波兰文和匈牙利文等(Latin-)ISO 8859-3欧洲东南部和其它各种文字(Latin-3)ISO 8859-斯堪的那维亚和波罗的海语系(Latin-)ISO 8859-5拉丁文与斯拉夫文(俄文、保加利亚文等
22、)ISO 8859-拉丁文与阿拉伯文ISO 8859-7拉丁文与希腊文ISO 8859-8拉丁文与希伯来文ISO 8859-9为土耳其文修正的Latin-1(Latin-5)ISO 8859-10拉普、北欧与斯基摩的文字(Latin-)ISO 8859-11拉丁文与泰文ISO 8859-13波罗的海周边语系,例如拉维亚文等(Latin-7)ISO 8859-1凯尔特文,例如盖尔文、威尔士文等(Latin-8)ISO 8859-15改进的Latin-1,增加遗漏的文、芬兰文字符和欧元符号(Latin-9)ISO 8859-1罗马尼亚文(Latin-10)其中缺少的编号1据说是为了预留给天城体梵文
23、字母(Deva-nagari)的。印地文和尼泊尔文都使用了这种在七世纪形的字母表。由于印度定义了自己的编码ISCII(Indian Script Code for Information Interchan算命号码ge),所以这个编号就未被使用。ISO 8859系列字符集都是单字节字符集,即只使用0x00-0xFF对字符编码。大家都知道ASCII吧,那么大家知道ANSI X3.和ISO吗?在198年发布的ANSI X3.和197年发布的ISO就是ASCII编码,只不过是不同组织发布的。绝大多数字符集都与ASCII编码维系兼容,ISO 8859系列字符集也不例外,它们的0x00-0x7f都与AS
24、CII码维系一致,各字符集的不同之处在于如何利用0x80-0xff的码位。使用UniToy可以查看ISO 8859系列所有字符集的编码,例如:通过这些演示,大家是不是觉得代码页和字符集都是很简单、朴实的东西呢?好,在进入Unicode的话题前,让我们先看一个很深奥的概念。程序员经常会面对复杂的问题,而降低复杂的最简单的方就是分而治之。Peter Constable在他的文章Character set encoding basics Understanding character set encodings and legacy encodings中描述了字符编码的层模型。我觉得这种说确实可以更
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 风水算命 123号码测试吉凶 算命看风水 关于风 风水 算命 123 号码 测试 吉凶 关于
链接地址:https://www.31doc.com/p-2371508.html