utf 8

  • Scala UTF-8方式读取属性文件,支持克隆
    Scala UTF-8方式读取属性文件,支持克隆

    /** Xiaohei's Devlopment Stdio */ package com.ldg.util import java.util.concurrent.ConcurrentHashMap import scala.io.Source import com.typesafe.config.ConfigFactory /** * @author 李代崗 * @version 2015/05/04 22:23:41 * * Scala UTF-8方式读取属性文件,支持克隆 */ clas

    utf 8, scala, 克隆, 读取属性文件May 7

  • 在 Visual Studio 中如何修改源代码文件的 Encoding?

    今天在 github 网站中观察文件修改情况的时候,发现一个 .cs 文件中的汉字部分是乱码.意识到这是因为该文件的 Encoding 不是 UTF-8 造成的. 这篇文字介绍了如何修改一个源代码文件的 Encoding: http://stackoverflow.com/questions/840065/how-to-change-source-file-encoding-in-csharp-project-visual-studio-msbuild-ma Problem: Compiler

    utf 8, Encoding, 源代码文件May 7

  • Tomcat7项目迁移到Tomcat8中文乱码问题

    1. 问题描述 Tomcat7下项目切换到Tomcat8后,出现乱码. 无论Google还是百度,多数解决方法是server.xml设置URIEncoding="UTF-8". 对于Tomcat7下遇到乱码问题,这样配置是正确的:但是对Tomcat7正常,切换到Tomcat8乱码的情况无效. 2. 解决方法 Tomcat8的server.xml配置添加为URIEncoding="ISO-8859-1". 参考:官方迁移说明 3. 官方文档 https://tomca

    utf 8, 乱码, iso-8859-1, tomcat8, URIEncodingApril 8

  • php中json_encode UTF-8中文乱码的更好解决方法

    网上找到说json_encode编码设置为UTF-8中文就不会乱码,在用过一段时间之后就不太管用了,下面与大家分享更好的方法 最近在接口代码当中用到过json_encode,在网上找到说json_encode编码设置为UTF-8中文就不会乱码,经验证这办法确实是有效果的,但是不知道为什么,代码在用过一段时间之后就不太管用了.以下是自己的解决json_encode的办法.有更好的方法请分享出来吧! 第一种: 这种简单的做一个代码转换,urlcode之后再返回所需数组 我代码这样就足够了. 代码如下

    utf 8, 中文乱码, json encodeMarch 27

  • UTF-8 GBK UTF8 GB2312 之间的区别和关系介绍

    UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM.是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码 UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强.UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示.如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包. GBK是国家标准GB2312基础上扩容后兼容GB2312的

    utf 8, utf8, gb2312, gbkMarch 25

  • C++中可正确获取UTF-8字符长度的函数分享

    这篇文章主要介绍了C++中可正确获取UTF-8字符长度的函数分享,需要的朋友可以参考下 在C++的char*以及string中,使用的是字节流编码,即sizeof(char) == 1. 也就是说,C++是不区分字符的编码的. 而一个合法UTF8的字符长度可能为1-4位. 现在假设一串输入为UTF8编码,如何能准确的定位到每个UTF8字符的"CharPoint",而不会错误的分割字符呢? 参考这个页面:http://www.nubaria.com/en/blog/?p=289 可以改造

    utf 8, 字符长度March 24

  • ASP同一站点下gb2312和utf-8页面传递参数乱码的终极解决方法

    要解决ASP同一站点下gb2312和utf-8页面传递参数乱码问题,只需严格做到以下4点即可. ①.页面文件使用正确的编码,gb2312使用ANSI,utf-8使用utf-8: ②.ASP代码中设置正确的CODEPAGE,gb2312使用936,utf-8使用65001: ③.HTML代码中设置正确的charset,gb2312使用gb2312,utf-8使用utf-8: ④.将传递的参数值使用js的escape函数进行编码: 示例代码 t1.asp(ANSI编码): <%@LANGUAGE=&qu

    utf 8, gb2312, 参数乱码March 23

  • 使用不同的编码转换请求URL

    准备: 假如现在我们有一段URL: http://w3schools.com/my test.asp?name=fajar&car=bmw 前端处理方法: 我们可以使用JavaScript自带的工具类(红色标记)进行转换,例如: var uri_encode = encodeURIComponent( uri ); 输出的值为---->http%3A%2F%2Fw3schools.com%2Fmy%20test.asp%3Fname%3Dst%C3%Afaj%26car%3Dbmw var

    utf 8, ascii, urlFebruary 11

  • 编码表 ISO8859-1 GBK UTF-8

    常见的编码表  ASCII:美国标准信息交换码. • 用一个字节的7位可以表示.  ISO8859-1:拉丁码表.欧洲码表 • 用一个字节的8位表示.  GB2312:中国的中文编码表.  GBK:中国的中文编码表升级,融合了更多的中文文字符号.  Unicode:国际标准码,融合了多种文字. • 所有文字都用两个字节来表示,Java语言使用的就是unicode  UTF-8:最多用三个字节来表示一个字符. 转换流的编码应用  可以将字符以指定编码格式存储.  可以对文本数据指定

    utf 8, gbk, 编码表, ISO8859-1February 8

  • UTF-8 Unicode Ansi 汉字GB2321几种编码转换程序

    今天搞sxna,遇到了编码转换的难题,搞了一个多小时,历尽千辛万苦,总算总结了如下的汉字转换为各种UTF-8 Unicode Ansi编码的程序.不敢独享,特此奉献给各位编程爱好者! -------------------------------------------------------------------------------- 符合GOOGLE的UTF编码 汉字 经过encodeURIComponent变成 %E6%B1%89%E5%AD%97 %E6%B1%89%E5%AD%9

    utf 8, unicode, ansi, 汉字GB2321几种编码转换程序January 30

  • android POST数据遇到的UTF-8编码(乱码)问题解决办法

    这篇文章主要介绍了android POST数据遇到的UTF-8编码(乱码)问题解决办法,需要的朋友可以参考下 今天遇到这样一个bug:客户端POST到服务器的一段数据导致服务器端发生未知异常.服务器端确认是编码转换错误.于是截取网络数据包进行分析,发现客户端POST的json数据中包含下面一段(hex形式): ... 61 64 20 b7 20 52 69 63 ... 问题就出在这个b7上.查阅Unicode代码表后发现,U+00b7是MIDDLE DOT,它的UTF-8表现形式应该是c2

    utf 8, androidJanuary 29

  • 转:中文编码杂谈

    关于一篇中文编码的文章,挺不错的,就是没有分享外链. 下面的文章内容只是简单的复制/粘贴,如果觉得不错的话,可以查看原文. 原文地址:http://www.searchtb.com/2012/04/chinese_encode.html PS:使用fedora系统,刚刚输入"粘贴"时,居然要用拼音"niantie"才能出来!!! ================================================================== 编码

    utf 8, gb2312, gbk, gb18030, UTF-16, UTF-32January 26

  • php中文乱码怎么办如何让浏览器自动识别utf-8

    调试php的时候经常显示乱码,每次打开浏览器都要改下编码,下面为大家介绍个不错的方法让浏览器自动识别为utf-8,有类似情况的额朋友可以参考下 刚开始学习php的朋友可能经常遇到问题,就是调试的时候经常显示乱码 每次打开浏览器都要改下编码,很麻烦, 有没有方法让浏览器自动识别utf-8呢? 解决的方法很简单 就是在php里加一句header 例: header("Content-type: text/html; charset=utf-8"); echo '我是初学者'; 不错需要注意

    utf 8, 中文乱码January 9

  • UTF-8 BOM 可能导致样式错乱的解决方法
    UTF-8 BOM 可能导致样式错乱的解决方法

    utf-8 是一种在web应用中经常使用的一种 unicode 字符的编码方式,使用 utf-8 的好处在于它是一种变长的编码方式,对于 ANSII 码编码长度为1个字节,这样的话在传输大量 ASCII 字符集的网页时,可以大量节约网络带宽. 使用 utf-8 编码来编写网页的时候, 往往会因为 bom (Byte Order Mark) 的问题,导致网页中经常出现一些不明的空行或者乱码字符. 这些都是因为 utf-8 编码方式对于 bom 不是强制的.因此 utf-8 编码在保存文件的时候,会

    utf 8, bom, 样式错乱December 28

  • Sublime Text [Decode error - output not utf-8]
    Sublime Text [Decode error - output not utf-8]

    问题: Sublime Text 在build Python时,如果python源代码里有中文,例如"print('中文')",Sublime Text 会报 [Decode error - output not utf-8] 分析: 在Sublime Text里,新建一个python源码文件,内容为: import sys print(sys.stdin.encoding) print(sys.stdout.encoding) ctrl + B build该文件.默认输出应该是: c

    utf 8, TEXT, output, sublimeNovember 20

  • python selenium utf-8 问题

    高端自动化测试交流群: 310924886 'utf8' codec can't decode byte 0xe4 in position 0: unexpected end of data # -*- coding: UTF-8 -*- from selenium import webdriver import time,os import codecs import sys source=open("D:/uxiaoxinlenium/testdata/data.txt",&quo

    utf 8, python, seleniumNovember 19

  • 编码那点事
    编码那点事

    编码那点事 编码一直是让新手头疼的问题,特别是 GBK.GB2312.UTF-8 这三个比较常见的网页编码的区别,更是让许多新手晕头转向,怎么解释也解释不清楚.但是编码又是那么重要,特别在网页这一块.如果你打出来的不是乱码,而网页中出现了乱码,绝大部分原因就出在了编码上了.此外除了乱码之外,还会出现一些其他问题(例如:IE6 的 CSS 加载问题)等等.潜行者m 写出本文的目的,就是要彻底解释清楚这个编码问题!如果你遇到了类似的问题,那就要仔细的看看这篇文章. ANSI.GBK.GB2312.U

    utf 8, gb2312, gbk, gb18030, unicode, ansi, 编码October 29

  • python学习--编码
    python学习--编码

    为了将各种不同的语言都包含在同一的字符集中,满足国际间的信息交流国际上制定了UNICODE字符集. 通过使用UNICODE字符集可以满足跨语言的文字处理,有效的避免乱码产生. 使用方法:在脚本中增加以下代码行之一 #-*- coding:utf-8 -*- #coding:utf-8 注意:如果是在命令行输出中文,则需要设定编码为cp936, 文件格式保存为utf-8编码 示例代码: #coding:utf-8 ch = '在中使用中文需要注意字符编码问题' print ch print ch.

    utf 8, python, unicode, 乱码, 编码August 10

  • pentaho中Invalid byte 3 of 3-byte UTF-8 sequence的解决方法

    今天在创建数据源的时候报了这么一个错 Invalid byte 3 of 3-byte UTF-8 sequence. 上网一查,说是有中文,字体不相符,可是我没有写中文,为了能继续往后进行,修改了如下文件 在start-pentaho.bat中添加了一句代码 修改前 IF "%BITS%" == "64" ( set CATALINA_OPTS=-Xms1024m -Xmx2048m -XX:MaxPermSize=256m -Dsun.rmi.dgc.clien

    utf 8, byte, sequence, Invalid, 3-byteJuly 30

  • PHP中文乱码问题总结

    PHP中文乱码问题总结 一.HTML中的中文乱码问题 HTML head标签: 在head标签里面加入UTF8编码(国际化编码):UTF-8是没有国家的编码,也就是独立于任何一种语言,任何语言都可以使用的. <meta http-equiv="Content-Type" content="text/html; charset=utf-8"/> HTML文件编码: 将文件的编码存为UTF-8.记事本.Editplus.notepad++等编辑器都有保存时选

    utf 8, PHPMarch 29

  • java字符串的各种编码转换

    import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符,也叫作ISO646-US.Unicode字符集的基本拉丁块 */ public static final String US_ASCII = "US-ASCII"; /** ISO 拉丁字母表 No.1,也叫作 ISO-LATIN-1 */ public static fina

    utf 8, gbk, Java, 编码, 字符编码March 12

  • golang读取文件编码转换问题

    首先导入包 "code.google.com/p/mahonia" 可以通过此链接获得此包 https://code.google.com/p/mahonia/ 参考代码如下: package main import ( "bufio" "code.google.com/p/mahonia" "log" "os" "strings" "time" ) func mai

    utf 8, gb18030, Golang, 编码转换, mahoniaFebruary 25

  • Java中的字符编码
    Java中的字符编码

    在日常开发中,经常会遇到关于编码的问题,让人总有种弄不清的感觉,这次我就整理一下,以便自己复习和大家分享,文中如有错误请及时指正. ASCII编码 先说说编码的由来,它的由来再简单不过了,为了让计算机存储字符.大家知道计算机底层的处理只有二进制,也就是0和1.在没有计算机的时候,人们使用8个晶体管来表示状态和动作,怎么表示呢?也就是说,每个晶体管可以亮或者灭,也就是0和1,根据8个晶体管不同的亮灭组合来表示不同的意思.那么根据数学知识可以知道,一共有256种组合方式(2的8次方). 这256种表

    utf 8, gbk, unicode, Java, 字符编码February 16

  • ios gb2312转utf-8

    靠,想写个爬虫功能,结果一直是乱码,终于找到了转码的方法了 +(NSString *) gb2312toutf8:(NSData *) data{ NSStringEncoding enc =CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000); NSString *retStr = [[NSString alloc] initWithData:data encoding:enc]; return re

    utf 8, gb2312, ios, NSStringEncodingOctober 25

  • PHP 正则判定中文 UTF-8 ;GBK

    UTF-8匹配:在javascript中,要判定字符串是中文是很简朴的.比如:var str = "php编程";if (/^[\u4e00-\u9fa5]+$/.test(str)) {alert("该字符串全部是中文");} else{alert("该字符串不全部是中文");}php中,是用 ... UTF-8匹配: 在javascript中,要判定字符串是中文是很简朴的.比如: var str = "php编程"; if

    utf 8, gbkJuly 2

  • [转]字符编码笔记:ASCII,Unicode和UTF-8
    [转]字符编码笔记:ASCII,Unicode和UTF-8

    本文转自http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html 1. ASCII码 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte).也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111. 上个世纪60年代,美国

    utf 8, unicode, asciiMay 26

  • 编码和编码格式,以及如何理解"java中字符串的编码"

    编码和编码格式,以及如何理解"java中字符串的编码" 首先明确几点: unicode是一种"编码",所谓编码就是一个编号(数字)到字符的一种映射关系,就仅仅是一种一对一的映射而已,可以理解成一个很大的对应表格 GBK.UTF-8是一种"编码格式",是用来序列化或存储1中提到的那个"编号(数字)"的一种"格式":GBK和UTF-8都是用来序列化或存储unicode编码的数据的,但是分别是2种不同的格式: 他

    utf 8, gbk, unicodeMay 22

  • [转] 字符编码简介:ASCII,Unicode,UTF-8,GB2312

    1. ASCII码 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和 1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte).也就是说,一个字节一共可以用来表示256种不同的状态,每一个 状态对应一个符号,就是256个符号,从0000000到11111111. 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定.这被称为ASCII码,一直沿用至今.ASCII码一共规定了128个字符的编

    utf 8, gb2312, gbk, unicode, asciiApril 22

  • [转] ASCII,Unicode,UTF-8,GB2312编码之间的关系

    从文件编码的方式来看,文件可分为ASCII码文件和二进制码文件两种. ASCII文件也称为文本文件,这种文件在磁盘中存放时每个字符对应一个字节,用于存放对应的ASCII码.例如,数5678的存储形式为: ASC码: 00110101 00110110 00110111 00111000 ↓ ↓ ↓ ↓ 十进制码: 5 6 7 8 共占用4个字节.ASCII码文件可在屏幕上按字符显示, 例如源程序文件就是ASCII文件,用DOS命令TYPE可显示文件的内容. 由于是按字符显示,因此能读懂文件内容.

    utf 8, gb2312, unicode, asciiApril 22

  • linux php freetds mssql 2008 簡體 繁體 共存 採用 UTF-8

    一般人都知道mssql unicode可以存什麼體,都OK, 而你可以用nvarchar或者nchar就可以搞定!要不然數據庫裡,老是出現煩人的問號??? [環境介紹] CentOS 6.x (請全部yum,php php-mssql freetds ....)以下略 重點來了 請在/etc/freetds.conf改一下設定 tds version = 8.0 (不要懷疑,這個我找了好多參考,如果你採用mssql 2000以上,就用這個) text size = 20971520 (這個大小不

    utf 8, freetds, mssql, 2008, 共存, 簡體, 繁體, 採用April 16

  • UTF-8和GBK的NSString相互转化

    GBK---文字编码,汉字编码 UTF-8 ---- 国际通用 从 GBK 转到 UTF-8: 用 NSStringEncoding enc =CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000) , 然后就可以用initWithData:encoding来实现 从 UTF-8 转到 GBK CFStringConvertEncodingToNSStringEncoding(kCFStringEncod

    utf 8, gbk, 字符编码April 1

  • DOM方式保存xml为UTF-8格式

    代码如下: import java.io.FileOutputStream; import java.util.Properties; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.transform.OutputKeys; import javax.xml.transform.Result; import javax.xml.

    utf 8, xml, DOMMarch 21

  • Golang 中 GBK 与 UTF-8 的转换

    1.导⼊ mahonia 包,创建 gb18030 Decoder 进⾏行编码转换 http://code.google.com/p/mahonia 例子: import ( "bufio" "code.google.com/p/mahonia" "log" "os" ) func checkError(err interface{}) { if err != nil { log.Fatal(err) } } func mai

    utf 8, gbk, GolangMarch 4

  • IOS编码GB2312转UTF-8

    在项目项目中,我们有的时候需要经常遇到编码的转换,下面给出GB2312转换为UTF-8的方法 + (NSData *)UTF8WithGB2312Data:(NSData *)gb2312Data { NSStringEncoding enc = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000); NSString *str = [[NSString alloc] initWithData:gb23

    utf 8, gb2312, ios编码, 字符编码转换February 28

  • UTF8 GBK

    某年去某买面试的时候给了一道这个题,今天顺便整理下. UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM.是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码.UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强.UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示.如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包. GB

    utf 8, gbk, PHPJanuary 11

  • Ajax+JQuery+JSon传输中文字符时,必须注意中文字符的编码解码工作

    Ajax+JQuery+JSon传输中文字符时,必须注意中文字符的编码解码工作 两种情况: 如果页面编码是GBK,则在Jquery+Ajax+Json中传输数据,尤其是中文字符, 则必须注意对中文字符串进行编码封装 , 如:username : encodeURI($username),// 中文必须重新编码 在Servlet接收数据过程中,也必须进行解码工作, 如:String name = java.net.URLDecoder.URLDecoder.decode(request.getPa

    utf 8, ajax, json, jquery, 乱码December 14

  • JSP中文乱码问题解决方法小结

    在使用JSP的过程中,最使人头疼的一个问题就是中文乱码问题,以下是我在软件开发中遇到的乱码问题以及解决方法. 1.JSP页面乱码 这种乱码的原因是应为没有在页面里指定使用的字符集编码,解决方法:只要在页面开始地方用下面代码指定字符集编码即可,<%@ page contentType="text/html; charset=gb2312"? %> 2.数据库乱码 这种乱码会使你插入数据库的中文变成乱码,或者读出显示时也是乱码,解决方法如下: 在数据库连接字符串中加入编码字符集

    utf 8, jsp, Java, 中文乱码, iso-8859-1November 11

  • JSP中request.getParameter()乱码问题

    [转]JSP中request.getParameter()乱码问题 博客分类: java中的字符编码 第一,存文件必须以一种编码存:读文件也必须以一种编码读,如不特别设置,去系统默认的编码,中文windows为GBK编码. 从.java->.class过程是,先编写.java文件并按莫种编码方式保存,然后用javac方法编译此文件,注意如.java没按系统默认编码保存则要带encoding参数指明实际编码,否则出错,生成的.class文件存为系统默认编码. 从.jsp->.java->.

    utf 8, gbk, 乱码, iso-8859-1November 11

  • C#输入转换为UTF-8字符串

    string input="I love you"; byte[] encodeBytes = System.Text.Encoding.UTF8.GetBytes(input); string inputString= System.Text.Encoding.UTF8.GetString(encodeBytes); Console.writeln(inputString);

    utf 8, System.Text.EncodingOctober 26

  • 解决ezSQL编码问题

    这样问题的出现,感觉很鸡肋: 我的ezSQL版本是2.17 编辑 ez_sql_mysql.php 文件,在96行添加一段代码 if(is_resource($this->dbh) && get_resource_type($this->dbh) == 'mysql link') { @mysql_query('set names utf8',$this->dbh); } 问题解决了!

    utf 8, 乱码, 编码, ezSQLOctober 12

  • 解释BOM头及去掉BOM头方法

    什么是bom头? 在utf-8编码文件中BOM在文件头部,占用三个字节,用来标示该文件属于utf-8编码,现在已经有很多软件识别bom头,但是还有些不能识别bom头,比如PHP就不能识别bom头,这也是用记事本编辑utf-8编码后执行就会出错的原因了.其实UTF-8 的BOM对UFT-8没有作用,是为了支援UTF-16,UTF-32才加上的BOM,BOM签名的意思就是告诉编辑器当前文件采用何种编码,方便编辑器识别,但是BOM虽然在编辑器中不显示,但是会产生输出,就像多了一个空行. 类似WINDO

    utf 8, Java, 去除, BOM头September 21

  • Tomcat解决UTF-8乱码的问题

    修改tomcat安装目录conf/server.xml文件 /Connector port="8080" 查找Connector port="8080"这段文字 然后在后面添加 useBodyEncodingForURI="true" 重启tomcat

    utf 8, tomcatSeptember 7

  • UTF-8 GBK UTF8 GB2312 之间的区别和关系

    UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM.是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码.UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强.UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示.如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包. GBK是国家标准GB2312基础上扩容后兼容GB2312的

    utf 8, gb2312, gbk, 编码September 5

  • C++:UTF-8.UTF-16.UTF-32之间的编码转换

    开发语言:C++ 功能描述: Unicode内码转换器.用于UTF-8.UTF-16(UCS2).UTF-32(UCS4)之间的编码转换. 下载地址: UnicodeConverter.zip 版本历史: V1.0 2010年03月12日 完成正式版本. 源代码: UnicodeConverter.h /* ---------------------------------------------------------- 文件名称:UnicodeConverter.h 作者:秦建辉 MSN:s

    utf 8, UTF-16, UTF-32August 2

  • [转]zh_CN.UTF-8 环境下 Putty 的配置
    [转]zh_CN.UTF-8 环境下 Putty 的配置

    当前的 Linux 发行版,选择中文环境后,缺省的 Locale 设置基本都是 zh_CN.UTF-8.由于我们Win32缺省的字符集环境通常是 GBK/GB18030,导致 putty 登录上去后访问 UTF-8 编码的中文文件不正常.以前我只是修改环境变量为 zh_CN.GB2312,然后只操作 GB 编码的文件:最近已经完全调整为纯的 UTF-8 工作环境了. 首先选择一个中文字体,可能有人喜欢 Fixedsys (我以前一直用的是从 NetTerm 提供的 isi_oem 字体),但是很

    utf 8, ssh, putty, 乱码July 13

  • Tomcat插件Sysdeo Tomcat plugin启动报错

    今天测试出的一个小问题. 使用Sysdeo Tomcat plugin启动tomcat时报错.两条异常如下,堆栈就不打出来了啊. org.eclipse.core.runtime.CoreException: Unable to parse XML document. org.eclipse.core.runtime.CoreException[120]: org.xml.sax.SAXParseException: Invalid byte 2 of 2-byte UTF-8 sequence

    utf 8, byte, sequence, Invalid, tomcat插件, 2-byteMay 23

  • Reading UTF-8 with C++ streams
    Reading UTF-8 with C++ streams

    Introduction This article is about reading and writing Unicode to character streams in UTF-8 encoding. And as a consequence is about an often mis-known aspect of the C++ STL / Iostream library: locales. The documentation that come with the STL itself

    utf 8, utf8April 26

  • [备忘]IE6不完全支持UTF-8导致汉字乱码的BUG~

    环境:Windows XP SP3 简体中文版.IE6.Tomcat 6.0.32.JDK 1.6.0.23 配置:JSP页面charset=UTF-8" pageEncoding="UTF-8",tomcat的Server.xml中配置URIEncoding="utf-8",Struts2的struts.xml中也配置了编码为UTF-8. ------------------------------------分隔线-------------------

    utf 8, IE6, bug, 汉字乱码December 24

  • Unicode和UTF-8

    1. 各地的方言 首先说明一下现在常用的一些编码方案: 1. 在中国,大陆最常用的就是GBK18030编码,除此之外还有GBK,GB2312,这几个编码的关系是这样的. n 最早制定的汉字编码是GB2312,包括6763个汉字和682个其它符号 n 95年重新修订了编码,命名GBK1.0,共收录了21886个符号. n 之后又推出了GBK18030编码,共收录了27484个汉字,同时还收录了藏文.蒙文.维吾尔文等主要的少数民族文字,现在WINDOWS平台必需要支持GBK18030编码. 按照GB

    utf 8, sqlite, unicode, 中文乱码, 乱码January 4

  • spring 使用 groovy 的 utf-8 问题

    spring 中使用动态 groovy bean 没有可设置 groovy 脚本文件的编码,是使用系统默认的编码.工作中,服务器上的系统默认编码不是 utf-8,郁闷,写的 groovy 是用 utf-8 编码.程序一发布到服务器上运行结果不正确. spring 中的 xml 没能配置文件编码,就连在 spring 的xml 内嵌 groovy 脚本都无法使 groovy 正常运行.记得之前的程序是改变系统默认编码的方式来运行 java 程序.那也拿来用用. java 有个启动属性参数:file

    utf 8, groovy, springFebruary 27