utf8

  • php下检测字符串是否是utf8编码的代码

    给一个字符串,怎么判断它是什么编码呢?php有一个函数:mb_detect_encoding.不过这个东西需要有mb_string库,不是到处都能用的. function is_utf8($string) { return preg_match('%^(?: [\x09\x0A\x0D\x20-\x7E] # ASCII | [\xC2-\xDF][\x80-\xBF] # non-overlong 2-byte | \xE0[\xA0-\xBF][\x80-\xBF] # excluding

    utf8, PHP, 检测字符串May 2

  • UTF8编码内的繁简转换的PHP类

    在网上找了很久都没有找到UTF8字符集内的繁简转换,或许网上已经有人写过这样的代码. 曾找过一个JS版的,但是到了UTF8编码里不能用,于是就产生了自已写一个的念头.其实我这个代码的实现原理很简单的,只是一个替换字符集的过程,相信大部份人都可以写得出来.以下是代码,不知道有没有bug,大家如果在使用上有问题,可以提出来 <?php //<meta charset=utf-8"> class utf8_chinese { private $utf8_gb2312; private

    utf8, 繁简转换April 29

  • UTF-8 GBK UTF8 GB2312 之间的区别和关系介绍

    UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM.是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码 UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强.UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示.如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包. GBK是国家标准GB2312基础上扩容后兼容GB2312的

    utf 8, utf8, gb2312, gbkMarch 25

  • centos6和centos7数据库配置默认编码

    数据库都使用yum安装 centos6 一般使用:default-character-set = utf8mb4 centos7 就需要改变为: default_character_set = utf8mb4 或 character_set_server = utf8mb4

    utf8, MySQL, 编码March 25

  • PHP检测字符串是否为UTF8编码的常用方法

    这篇文章主要介绍了PHP检测字符串是否为UTF8编码的常用方法,列举了四个实例从不同的角度来实现这一功能,是非常实用的技巧,具有一定的学习借鉴价值,需要的朋友可以参考下 本文实例总结了PHP检测字符串是否为UTF8编码的常用方法.分享给大家供大家参考.具体实现方法如下: 检测字符串编码可以有很多种方法,如利用ord获得字符的进制然后进入判断,或利用mb_detect_encoding函数来处理,下面整理了四种常用方法供大家参考. 例子1 /** * 检测字符串是否为UTF8编码 * @param

    utf8, PHP, 字符串, 检测March 25

  • 真正根据utf8编码的规律来进行截取字符串的函数(utf8版sub_str )

    真正根据utf8编码的规律来进行截取的字符的函数,utf8版sub_str 支持1~6个字节的字符的截取,而非只针对中文,比网上的全 /* * 功能: 作用跟substr一样,除了它不会造成乱码 * 参数: * 返回: */ function utf8_substr( $str , $start , $length=null ){ // 先正常截取一遍. $res = substr( $str , $start , $length ); $strlen = strlen( $str ); /*

    utf8, 截取字符串March 15

  • js 编码转换 gb2312 和 utf8 互转的2种方法

    这篇文章介绍了gb2312 和 utf8 互转的JS方法,有需要的朋友可以参考一下 方法一: function gb2utf8(data){ var glbEncode = []; gb2utf8_data = data; execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript"); var t=escape(gb2utf8_data).replace(/%u/g,"").repl

    utf8, gb2312, 编码March 4

  • utf8编码检测方法分享

    这篇文章主要介绍了utf8编码检测方法示例,需要的朋友可以参考下 public bool isUtf8(byte[] rawText) { bool result = true; if (rawText == null) { return !result; } int pos = 0; while (pos < rawText.Length && result) { if ((rawText[pos] & 0x7F) == rawText[pos]) { pos++; } e

    utf8, 编码February 1

  • javascript中的Base64.UTF8编码与解码详解

    本文给大家介绍的是javascript中的Base64.UTF8编码与解码的函数源码分享以及使用范例,十分实用,推荐给小伙伴们,希望大家能够喜欢. Base64编码说明 Base64编码要求把3个8位字节(3*8=24)转化为4个6位的字节(4*6=24),之后在6位的前面补两个0,形成8位一个字节的形式. 如果剩下的字符不足3个字节,则用0填充,输出字符使用'=',因此编码后输出的文本末尾可能会出现1或2个'='. base64编码库:(已验证可用) var base64 = (functio

    utf8, base64, JavaScriptJanuary 20

  • C++字符编码问题探究和中文乱码的产生

    引言 一直以来,C/C++对中文字符的处理时常让人摸不着头脑. 主要有下面几个原因: 文件编码方式的差异 系统环境对中文的解释有差异 不同编译器对标准库的实现有差异 而这三者往往又相互影响,暗藏玄机,让人抓狂. 在写本文之前我查阅了很多博客,关于中文的输入输出,cout,wcout,fstream,wfstream,乱码解决方案等等问题都有了十分详细的解答,但是,很多博文具有片面性. 许多博主仅仅是针对自己所使用的环境做阐述,而又没有明确指明使用了何种IDE,何种编译器,何种系统.结果就是,博主

    utf8, ansi, 乱码, 编码, wcoutJanuary 2

  • php 判断网页是否是utf8编码的方法

    这篇文章主要介绍了php 判断网页是否是utf8编码的方法,需要的朋友可以参考下 //判断编码 $encode = mb_detect_encoding($q, array('GB2312','GBK','UTF-8')); echo $encode."<br/>"; if($encode=="GB2312") { $q = iconv("GBK","UTF-8",$q); } else if($encode==&

    utf8, 网页, mb detect encodingJanuary 1

  • PHP通过iconv将字符串从GBK转换为UTF8字符集

    PHP通过iconv将字符串从GBK转换为UTF8字符集的方法,需要的朋友可以参考下. 1. iconv()介绍 iconv函数可以将一种已知的字符集文件转换成另一种已知的字符集文件.例如:从GB2312转换为UTF-8. iconv函数在php5中内置,GB字符集默认打开. 2. iconv()错误 iconv在转换字符"-"到gb2312时会出错,解决方法是在需要转成的编码后加 "//IGNORE",也就是iconv函数第二个参数后.如下: iconv(&quo

    utf8, gbk, iconvDecember 29

  • svn中import 从本地编码转换到UTF8失败

    svn :xx目录 中的条目从本地编码转换到UTF 8失败 svn:有效UTF-8数据 (16进制) 后面是无效UTF-8序列 (16进制:b8 b4 bc fe) 1:导入的文件中不能包含有中文,包含中文就会导致

    utf8, svn, 编码December 27

  • MySQL的中文UTF8乱码问题

    MySQL从4.x版本开始支持Unicode,3.x只有latin1编码.刚工作的时候就开始用MySQL了,用的php存取,网页xxx.php是gb2312的编码,存进去的数据用php取出来是中文,用phpMyAdmin执行select.update.dump都是中文,没有乱码问题. 从MySQL支持Unicode后,为了与时俱进,我们的web程序也开始考虑用UTF8了.其实UTF8也用了好几年了,程序基本能跑,没什么大问题,但是数据倒换的时候,总是遇到不爽的事情. [问题现象] 网页xxx.p

    utf8, MySQL, 中文, 乱码December 11

  • C++ ORM ODB mysql 中文问题

    系统必须统一字符编码,建议均为utf8 1) 在mysql的服务器配置 my.cnf 中的配置,必须把服务器的默认编码设置为 utf8 2)在创建表格的时候,必须指定表格的编码为utf8,(ODB自动生成的DDL语句,默认是UTF8),这点从 show create table table_name可以得到确认. 3)最关键的地方就是客户端需要设置编码,由于编译ODB时,使用的mysql c api的版本默认的编码可能是不是UTF8编码,所以必须在 odb::mysql::database的构造

    utf8, odb, 中文November 27

  • CentOS6.5安装mysql中文乱码问题解决

    1.首先安装mysql,我很怕麻烦..所以全给安装了一下,不管那么多依赖关系了,省心. yum install -y mysql-server mysql mysql-devel 2.安装好了之后,启动看下是什么情况 service mysqld start 3.没啥问题,设置一下root密码,一开始root是没有密码的,所以我直接设置密码为123456 mysqladmin -u root password '123456' 4.登录进mysql看看是个什么情况. mysql -u root

    utf8, linux, centos, MySQL, 中文乱码October 28

  • MySql修改数据库编码为UTF8避免造成乱码问题

    mysql 创建数据库时指定编码很重要,很多开发者都使用了默认编码,乱码问题可是防不胜防,下面与大家分享下通过修改数据库默认编码方式为UTF8来减少数据库创建时的设置,避免因粗心造成的乱码问题 mysql 创建数据库时指定编码很重要,很多开发者都使用了默认编码,乱码问题可是防不胜防.制定数据库的编码可以很大程度上避免倒入导出带来的乱码问题. 网页数据一般采用UTF8编码,而数据库默认为latin .我们可以通过修改数据库默认编码方式为UTF8来减少数据库创建时的设置,也能最大限度的避免因粗心造成

    utf8, 乱码, 数据库编码October 26

  • asp中utf8不会出现乱码的写法

    有时候我们在asp编写中需要声明好页面的编码否则容易出现乱码,这里是utf-8格式的 <%@ CODEPAGE=65001 %> <% Response.CodePage=65001%> <% Response.Charset="UTF-8" %> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR

    utf8, 乱码October 22

  • Lua中获取utf8字符串长度的方法和自定义函数

    这篇文章主要介绍了Lua中获取utf8字符串长度的方法和自定义函数,本文给出了代码实例并讲解了UTF8的编码规则,需要的朋友可以参考下 --- 获取utf8编码字符串正确长度的方法 -- @param str -- @return number function utfstrlen(str) local len = #str; local left = len; local cnt = 0; local arr={0,0xc0,0xe0,0xf0,0xf8,0xfc}; while left ~

    utf8, lua, 方法, 字符串长度, 自定义函数September 20

  • 对于SQL Server数据迁移至PostgreSQL出错的解释以及解决建议

    最近对SQL Server到PostgreSQL的数据迁移时出现了问题,返回的错误为:invalid byte sequence for encoding "UTF8": 0x00. 经查证pg源代码,该问题引起的原因是sql server的字符类型字段中含有空字符,该字符在pg中不支持. 问题重现: 1.PG客户端: postgres=# create table text_test (id int,info text); CREATE TABLE postgres=# insert

    sql, utf8, postgresql, Server, 迁移, 0x00September 9

  • php UTF8 文件的签名问题

    在我们保存UTF8文本文件的时候,可以选择带签名,或者不带签名. 也就是 有BOM 格式编码,或者 无BOM格式编码. 如果看文件的内容,是看不出任何差别的,以下列文件(schema.sqlite.sql)内容为例: schema.sqlite.sql CREATE TABLE guestbook ( id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT, email VARCHAR(32) NOT NULL DEFAULT '[email protecte

    utf8, PHPSeptember 4

  • PHP截断标题且兼容utf8和gb2312编码

    PHP截断标题的方法有很多,但同时可以兼容utf8和gb2312却不多了,下面有个不错的方法,可以参考下,或许对大家有所帮助 <?php if(strlen($r[title])>45){$str=utf8Substr($r[title],0,15)."...";}else{$str=$r[title];}echo $str; ?> //截取utf8字符串 function utf8Substr($str, $from, $len) { return preg_rep

    utf8, gb2312, PHP截断标题August 31

  • PHP UTF8中文字符截断函数代码

    今天需要用一个UTF-8的字符串截断函数,网上找了几个代码片段发现都有问题,于是查了一下原理自己写了一个函数,代码片段如下 php中英文混合字符截断不乱码函数(utf8) //utf8格式下的中文字符截断 //$sourcestr 是要处理的字符串 //$cutlength 为截取的长度(即字数) //$addstr 超过长度时在尾处加上的字符 function cut_str($sourcestr, $cutlength, $addstr='...'){ $returnstr=''; $i=0

    utf8, PHP, 中文字符截断August 31

  • UTF8转成GB2312乱码问题解决方案

    审核完的信息要生成XML类型的文件,并且XML要采用GB2312编码,因为采集的新闻网站,有很多网站采用的是UTF8编码,这样在转化的过程中又出现乱码 最近做了一个小项目,遇到此类问题,记录一下,也算是一个总结. 此项目分为两部分,一个是新闻数据采集,一个是采集信息的审核,最后生成XML文件. 数据采集后的数据经过用户编辑完之后,要导出一个ACCESS文件,然后把这个文件导入到信息审核系统.在ACCESS库中存储新闻信息的字段类型是ntext类型,而审核系统库中对应的是varchar(max)类

    utf8, gb2312August 1

  • 为SQLite3提供一个ANSI到UTF8的互转函数

    这篇文章主要为大家分享下ANSI与UTF8的互转函数,需要的朋友可以收藏下 在使用Sqlite3时必须要用到的 使用方法: char* src = "...";//待转换的ANSI或UTF8字符串 char* dst = NULL;//保存由函数内部分配的内存指针, 不需要传入内存缓冲区的 转换为UTF-8:to_utf8(src, &dst); 转换为ANSI:to_gb(src, &dst); 返回值:零 - 失败, 非零 - 成功. 注意:如果操作成功, 需要手动

    utf8, ansiJuly 14

  • PHP生成UTF8文件的方法

    先用函数utf8_encode将所需写入的数据变成UTF编码格式. <?php $f=fopen("test.txt", "wb"); $text=utf8_encode("a!"); //先用函数utf8_encode将所需写入的数据变成UTF编码格式. $text="\\xEF\\xBB\\xBF".$text; //"\\xEF\\xBB\\xBF",这串字符不可缺少,生成的文件将成为UTF-8

    utf8, PHPJune 17

  • php截取字符串之截取utf8或gbk编码的中英文字符串示例

    php中自带strlen是返回的字节数,对于utf8编码的中文返回时3个,不满足需求,下面给大家提供一个方法来完成这样的功能 微博的发言有字数限制,其计数方式是,中文算2个,英文算1个,全角字符算2个,半角字符算1个. php中自带strlen是返回的字节数,对于utf8编码的中文返回时3个,不满足需求. mb_strlen 可以根据字符集计算长度,比如utf8的中文计数为1,但这不符合微博字数限制需求,中文必须计算为2才可以. google了下,找到一个discuz中截取各种编码字符的类,改造

    utf8, gbk, PHP, 字符串, 中英文June 15

  • ASCII,Unicode和UTF-8
    ASCII,Unicode和UTF-8

    ASCII码 在计算机内部,所有的信息最终都表示为一个二进制的字符串. 每一个二进制位有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节. 一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111. 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定. 这被称为ASCII码,一直沿用至今. ASCII码一共规定了128个字符的编码. 这128个符号,只占用了一个字节的后面

    utf8, ascii, EncodingApril 11

  • JavaScript: 详解Base64编码和解码
    JavaScript: 详解Base64编码和解码

    Base64是最常用的编码之一,比如开发中用于传递参数.现代浏览器中的<img />标签直接通过Base64字符串来渲染图片以及用于邮件中等等.Base64编码在RFC2045中定义,它被定义为:Base64内容传送编码被设计用来把任意序列的8位字节描述为一种不易被人直接识别的形式. 我们知道,任何数据在计算机中都是以二进制的方式存储的.一个字节为8位,一个字符在计算机中存储为一个或多个字节,比如英文字母.数字以及英文标点符号就是用一个 字节来存储的,通常称为ASCII码.而简体中文.繁体中文

    utf8, unicode, base64, JavaScript, 编码, UTF16February 19

  • 中文编码杂谈(转)
    中文编码杂谈(转)

    编码问题的例子 在windows自带的notepad(记事本)程序中输入"联通"两个字,保存后再次打开,会发现"联通"不见了,代之以"��ͨ"的乱码.这是windows平台上典型的中文编码问题.即文件保存的时候是按照ANSI编码(其实就是GB2312,后面会详细介绍)保存,打开的时候程序按照UTF-8方式对内容解释,于是就出现了乱码.避免乱码的方式很简单,在"文件"菜单中选择"打开"命令,选择保存的文件,然

    utf8, 编码, UTF16, utf32February 13

  • php 汉语转拼音 utf8 gbk

    function Pinyins($_String, $_Code='UTF8'){ //GBK页面可改为gb2312,其他随意填写为UTF8 $_DataKey = "a|ai|an|ang|ao|ba|bai|ban|bang|bao|bei|ben|beng|bi|bian|biao|bie|bin|bing|bo|bu|ca|cai|can|cang|cao|ce|ceng|cha". "|chai|chan|chang|chao|che|chen|cheng|chi

    utf8, PHP, 拼音November 22

  • 字符集问题(Linux.oracle.终端等,导入导出数据)
    字符集问题(Linux.oracle.终端等,导入导出数据)

    locale的设定及其LANG.LC_ALL.LANGUAGE环境变量的区别 (转自:http://hi.baidu.com/edeed/item/c23752f36abdd916ce9f3289) 例如zh_CN.GB2312.zh_CN.GB18030或者zh_CN.UTF-8.很多人都不明白这些古里古怪的表达方式.这个外星表达式规定了什么东西呢?这个问题稍后详述,现在只需要知道,这是locale的表达方式就可以了. locale这个单词中文翻译成地区或者地域,其实这个单词包含的意义要宽泛很

    utf8, gbk, linux, gb18030, 字符集, 、unicodeNovember 1

  • UTF8\ASCII\UNICODE转换

    wchar_t * ANSIToUnicode( const char* str ) { int textlen ; wchar_t * result; textlen = MultiByteToWideChar( CP_ACP, 0, str,-1, NULL,0 ); result = (wchar_t *)malloc((textlen+1)*sizeof(wchar_t)); memset(result,0,(textlen+1)*sizeof(wchar_t)); MultiByteT

    utf8, unicode, ascii, 转换August 20

  • DataInputStream,DataOutputStream读写UTF8原理

    今晚上写代码玩,用到java.io.RandomAccessFile.writeUTF(String)函数,而文件默认保存为gbk,显然是乱码.突然想起来去看看存储编码规则,就去找了些文章了解writeUTF(String)的原理,在此记录. 首先需要弄明白unicode与utf8的表示规则,搜到@Feng哥的一篇文章<字符编码笔记:ASCII,Unicode和UTF-8>,写的很明白,在此招录一段: | Unicode符号范围 | UTF-8编码方式 | 0000 0000-0000 007

    utf8, randomaccessfile, Java, writeUTFJuly 29

  • 今天遇到Mysql 插入数据里有中文字符出现 Incorrect string value 的错误

    背景:CMD里直接敲代码插入数据 提示的部分截取为:ERROR 1366 (HY000): Incorrect string value 百度了一下,说是编码问题,show variables like 'character%' 查看后,发现所有编码都为UTF8,并没有错 继续查原因,网上有人说是mysql的编码集的问题以下为原文: "原来问题出在mysql上,mysql如果设置编码集为utf8那么它最多只能支持到3个字节的UTF-8编码,而4个字节的UTF-8字符还是存在的,这样一来如果你建表

    utf8, MySQL, 中文编码July 3

  • 关于PHP通过PDO用中文条件查询MySQL的问题.

    好久没有用PHP了,基本上忘的差不多了,项目刚开始就遇到了一个问题,用中文条件查询不显示结果.代码如下: $pdo = new PDO("mysql:host=127.0.0.1;dbname=", "", ""); $rs = $pdo->query("SELECT * FROM TextT WHERE MsgType=(SELECT MsgType FROM KeyWord WHERE KeyWord='优惠')")

    utf8, pdo, PHPJune 21

  • 利用java判断文件的编码方法

    在程序中,文本文件经常用来存储标准的ASCII码文本,比如英文.加减乘除等号这些运算符号.文本文件也可能用于存储一些其他非ASCII字符,如基于 GBK的简体中文,基于BIG5的繁体中文等等.在存储这些字符时需要正确指定文件的编码格式:而在读取这些文本文件时,有时候就需要自动判定文件的编码格式. 按照给定的字符集存储文本文件时,在文件的最开头的三个字节中就有可能存储着编码信息,所以,基本的原理就是只要读出文件前三个字节,判定这些字节的值,就可以得知其编码的格式.其实,如果项目运行的平台就是中文操

    utf8, gbk, Java, 文件, 编码May 19

  • utf8的问题

    在控制台上输入show variables like 'character%';发现已经是使用utf8了,但是还是显示不出来,你需要: 查询时,先输入set names gb2312(对于控制台) 或mysqli_query($dbc,'set names utf8');对于php

    utf8, MySQL, 中文May 15

  • 大话字符集和编码

    很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物.他们看到8个开关状态是好的,于是他们把这称为"字节". 再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出很多状态,状态开始变来变去.他们看到这样是好的,于是它们就这机器称为"计算机". 开始计算机只在美国用.八位的字节一共可以组合出256(2的8次方)种不同的状态. 他们把其中的编号从0开始的32种状态分别规定了特殊的用途,一但终端.打印机遇上约

    utf8, ascii, ansi, 编码, 字符集May 8

  • [转]字符集和编码

    很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物.他们看到8个开关状态是好的,于是他们把这称为"字节". 再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出很多状态,状态开始变来变去.他们看到这样是好的,于是它们就这机器称为"计算机". 开始计算机只在美国用.八位的字节一共可以组合出256(2的8次方)种不同的状态. 他们把其中的编号从0开始的32种状态分别规定了特殊的用途,一但终端.打印机遇上约

    utf8, ascii, ansi, unicod, UTF16April 22

  • VC2010下Qt5的中文乱码问题

    要搞清楚这个问题,先要弄明白编码.但是编码问题实在太复杂,这里肯定讲不开. 我先找一个例子,比如:"中文" 的 Unicode 码点/UTF8编码/GBK 分别是多少. 先去这个网站,输入 "中文" 查询对应的 Unicode 码点/UTF8编码: http://www.mytju.com/classcode/tools/encode_utf8.asp Unicode的码点分别是(十进制):中(20013),文(25991). 对应的UTF8编码分别(16进制):

    utf8, VS2010, Qt5, execution_character_setApril 4

  • 让Windows命令行显示UTF-8字符

    一直苦恼于如何在Windows终端中显示UTF-8字符的问题.比如,在MySQL命令行下,如果数据库的编码是UTF-8,那么,在查询数据库的时候,里面的中文都会变成乱码. 今天半无意的搜索了一下,结果发现解决方案非常简单: 1. 修改终端的代码页. 在终端中输入: chcp 65001 2. 右键点击任务栏上的终端(也可以单击窗口左上角的图标),在快捷菜单中选择属性,在里面选择字体--如 Lucida Console,不要选择"点阵字体": 确定之后,再次测试UTF-8输出,你看到了什

    utf8, shell, WindowsMarch 8

  • iconv实现编码转换与中文点阵字库HZK16
    iconv实现编码转换与中文点阵字库HZK16

    嵌入式开发中中文的识别.显示一直是一个比较让人头疼的问题,这是由于嵌入式系统的精简要求所导致的.我在前一个项目中用Qt做终端的显示界面时,就被中文字符的显示搞得焦头烂额,最后还是在网上下了一个文泉驿的中文字体库才解决问题,不过并不令人满意,主要是字体库太大了,影响了性能.今天在项目中又遇到了中文字符的编码转换和显示问题,趁机学习总结一下. 中文编码与点阵字库 国际标准有UTF-8.UTF-16等,国家标准有GB2312.GB18030.GBK等,至于这些标准的编码实现就不在这里介绍了.编码标准实

    utf8, gb2312, iconv, 中文编码, HZK16February 28

  • 关于wxWidgets控件出现乱码
    关于wxWidgets控件出现乱码

    这两天在用wxWidgets做一个小程序,突然遇到了一个控件显示出现乱码的问题. 首先声明:我用的编译器是Visual Studio 2005,wxWidgets版本是2.8.12,下面的解决方法不一定对所有的平台都有效. 我们知道,wxWidgets中控件显示字符串一般都是用wxString,例如下面的一小段代码创建并显示一个按钮: // 创建一个按钮,显示名称就是"按钮" wxButton* oneButton = new wxButton( itemFrame1, ID_BUTT

    utf8, wxwidgets, 乱码, 控件, wxStringOctober 12

  • MySQL5.x处理中文全解
    MySQL5.x处理中文全解

    我这边用 Java 连接 MySQL 数据库,通过 JDBC 写入数据.在 Java 中直接生成的中文字符串,写入数据库变成半角问号"?".以下是我解决此问题的记录. 首先,我用 Putty 这个工具连接 MySQL 以检查中文写入情况.这里有一个设置.此设置如果不对,则会导致乱码. 然后,MySQL 提供了关于字符集的很多变量.可以通过 MySQL 命令来查看. 输入命令:mysql> SHOW VARIABLES LIKE '%char%'; 会看到如下内容: 相信大家这些变

    utf8, charset, MySQL, 中文, 乱码August 24

  • [转]eclipse默认编码为GBK,修改为UTF8的方法

    eclipse 默认编码居然是GBK,js文件默认编码是ISO-.... 怎么可以这样呢? 都修改成UTF8的方法: 1.windows->Preferences...打开"首选项"对话框,左侧导航树,导航到general->Workspace,右侧 Text file encoding,选择Other,改变为UTF-8,以后新建立工程其属性对话框中的Text file encoding即为UTF-8. 2.windows->Preferences...打开"

    utf8, eclipse工程默认编码July 24

  • Reading UTF-8 with C++ streams
    Reading UTF-8 with C++ streams

    Introduction This article is about reading and writing Unicode to character streams in UTF-8 encoding. And as a consequence is about an often mis-known aspect of the C++ STL / Iostream library: locales. The documentation that come with the STL itself

    utf 8, utf8April 26

  • 两种可行的Latex中文生成方式(GBK/UTF8)

    本来想总结一下Latex里各种中文排版支持,但是发现太乱了,CCT,CJK,CTEX神马的,还有GBK和UTF8下的不同编码方式,再加上XeLatex这样来搅局的--所以最后决定只给出一种可行的排版方式,测试环境是Windows+CTex2.8. ps:每天忍辱负重的在Windows下用Vim和Latex-- 第一种是gbk编码下的编译方式 REM taskkill /im AcroRd32.exe pdflatex %1 bibtex %1 pdflatex %1 gbk2uni %1.out

    utf8, gbk, latex, 中文, beamer, ctexMarch 15

  • 关于Linux终端编码的一些记录:参考转载

    UTF8的环境设置为 1.putty的设置:Windows->translation->font->UTF-8, 登陆上去linux后系统的设置:(如果你系统默认的环境是UTF-8,则无须这一步) 2.系统编码设置 vi /etc/sysconfig/i18n LANG="zh_CN.UTF-8" 3.如果出现方框乱码,是缺少字体造成的,在安装光盘里,安装相应字体 4.VMware自动安装可能,导致没有相应中文字体 http://yuzeying.blog.51cto

    utf8, 编码April 1

  • 字符集和字符编码

    字符集和字符编码[订正] 这个主题已经被N多人讨论过了,这里仅仅是个人总结,不是教程. 字符集和字符编码 潘孙友 2010-12-31 于遵义 目录 一.字符集 二.字符编码 三.Windows平台 3.1 Codepage代码页 3.2 编码转换(API) 3.3 编码转换(CRT) [感谢@loop指出错误] 四.Linux/unix平台 4.1 iconv 4.2 ICU 一.字符集 字符集是一个集合,描述并定义了这个集合中可以出现哪些字符,常见的字符有GB2312.GBK.GB18030

    utf8, unicode, UTF16January 7