编码

  • 确定文本文件的编码--乱码探源(2)
    确定文本文件的编码--乱码探源(2)

    在上一篇中,探讨了文件名编码以及非文本文件中的文本内容的编码,在这里,将介绍更为重要的文本文件的编码. 混乱的现状 设想一下,如果在保存文本文件时,也同时把所使用的编码的信息也保存在文件内容里,那么,在再次读取时,确定所使用的编码就容易多了. 很多的非文本文件比如图片文件通常会在文件的头部加上所谓的"magic number(魔法数字)"来作为一种标识.所谓的"magic number",其实它就是一个或几个固定的字节构成的固定值,用于标识文件的种类(类似于签名).

    unicode, ansi, 乱码, 编码, 文本文件May 11

  • PHP编码转换减号(连接符)无法转换问题

    PHP编码转换减号(连接符)无法转换问题技术 maybe yes 发表于2015-01-23 16:03 原文链接 : http://blog.lmlphp.com/archives/67 来自 : LMLPHP后院 使 用 PHP 的 iconv 或 mb_convert_encoding 函数进行编码转换,比如将 gb2312 转换为 utf-8 编码,在出现某些特殊字符(减号,连接符)时,不能正常工作,可能会变成问号"?"或者"C".尝试了多种方法,依然不能很

    PHP, 转换, 编码, 连接符, 减号April 10

  • Android中一个webkit处理汉字编码的问题
    Android中一个webkit处理汉字编码的问题

    在XX项目中解决android webkit处理汉字编码问题的总结 问题: 服务器通过302重定向方式发送给客户端重定向地址,地址中的汉字采用原数据方式发送,没有经过任何编码.因为其中存在汉字,所以在android端经过webkit解码编码之后,最终无法正常在服务器端请求正确数据.Android中默认使用utf-8编码. Android在framework中解析http信息,Request.java的函数readResponse通过AndroidHttpClientConnection.java

    linux, android, webkit, 乱码, Framework, html, 字符, 编码, 解码April 2

  • centos6和centos7数据库配置默认编码

    数据库都使用yum安装 centos6 一般使用:default-character-set = utf8mb4 centos7 就需要改变为: default_character_set = utf8mb4 或 character_set_server = utf8mb4

    utf8, MySQL, 编码March 25

  • PHP-FIG PSR-1 # 基本编码标准

    本标准包含了 对 用于保障 PHP共享代码的互操作性 的标准编码元素. The key words "MUST 必须", "MUST NOT 必须不", "REQUIRED 需要", "SHALL 将要", "SHALL NOT 将不", "SHOULD 应该", "SHOULD NOT不应该", "RECOMMENDED 推荐的", "

    PHP, 共享, 编码, 标准March 10

  • Python的编码问题UnicodeEncodeError错误的解决

    今天写爬虫的时候又被各种编码问题恶心了一把,'#coding:utf-8'都失效了. 报错总是提示 UnicodeEncodeError: 'ascii' codec can't encode characters in position 貌似是因为编码问题:Unicode编码与ASCII编码的不兼容,其实这个Python脚本文件是由utf-8编码的,Python默认环境编码通过下面的方法可以获取: import sys print sys.getdefaultencoding() #输出结果

    python, 编码January 14

  • C++字符编码问题探究和中文乱码的产生

    引言 一直以来,C/C++对中文字符的处理时常让人摸不着头脑. 主要有下面几个原因: 文件编码方式的差异 系统环境对中文的解释有差异 不同编译器对标准库的实现有差异 而这三者往往又相互影响,暗藏玄机,让人抓狂. 在写本文之前我查阅了很多博客,关于中文的输入输出,cout,wcout,fstream,wfstream,乱码解决方案等等问题都有了十分详细的解答,但是,很多博文具有片面性. 许多博主仅仅是针对自己所使用的环境做阐述,而又没有明确指明使用了何种IDE,何种编译器,何种系统.结果就是,博主

    utf8, ansi, 乱码, 编码, wcoutJanuary 2

  • svn中import 从本地编码转换到UTF8失败

    svn :xx目录 中的条目从本地编码转换到UTF 8失败 svn:有效UTF-8数据 (16进制) 后面是无效UTF-8序列 (16进制:b8 b4 bc fe) 1:导入的文件中不能包含有中文,包含中文就会导致

    utf8, svn, 编码December 27

  • 字符串编码方案

    字符串编码方案是个即简单又麻烦的话题,这主要涉及到字节(byte) 和字符(character) 两个不同的概念.字节是计算机软件系统的最小存储单位,我们可以用n 个字节表达一个概念,诸如4 字节的32 位整数或着其他什么对象之类的,任何对象最终都是通过字节组合来完成存储的.字符也是一种对象,它和具体的语言有关,比如在中文里, "我" 是一个字符,不能生生将其当作几个字节的拼接. 早期的计算机系统编码方案主要适应英文等字母语言体系, ASCII 编码方案的容量足以表达所有的字符,于是

    字节, 字符, 编码December 20

  • python 编码
    python 编码

    参考文档: http://www.tuicool.com/articles/yIZrQ3 http://woodpecker.org.cn/diveintopython3/files.html http://www.cnblogs.com/txw1958/archive/2012/07/19/2598885.html http://eli.thegreenplace.net/2012/01/30/the-bytesstr-dichotomy-in-python-3/ 1.Pyhthon编码由来

    python, 编码December 13

  • 深入图解字符集与字符集编码(八)--ASCII和ISO-8859-1
    深入图解字符集与字符集编码(八)--ASCII和ISO-8859-1

    在前面其实也谈到了ASCII了,但并没有很具体,作为一个完整系列的一部分,还是有必要谈一下,也作为后面讨论的一些基础. ASCII 它的全称是American Standard Code for Information Interchange(美国信息交换标准代码),是一个7位字符编码方案.下面是它的一张简图(来自): ASCII定义了128个字符,包括33个不可打印的控制字符(non-printing control characters)和95个可打印的字符. 控制字符 32以下的及最后一个

    ascii, 编码, 字符集, iso-8859-1, 控制字符December 3

  • Java乱码总结(二)

    1.为什么要编码 首先计算机是只识别0或者1的(字节),但是我们平时使用的都是字符(英文,中文,其他...).所以,这期间就涉及到了字符与字节之间的转化过程.而这个过程(字节->字符,字符->字节)就是编码! 2.常用的编码"工具" ASCII编码:是目前计算机中用得最广泛的字符集及其编码.使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字符.标准ASCII 码也叫基础ASCII码,使用7 位二进制数来表示所有的大写和小写字母,数字0 到9.标点符号,

    Java, 乱码, 编码November 15

  • 编码那点事
    编码那点事

    编码那点事 编码一直是让新手头疼的问题,特别是 GBK.GB2312.UTF-8 这三个比较常见的网页编码的区别,更是让许多新手晕头转向,怎么解释也解释不清楚.但是编码又是那么重要,特别在网页这一块.如果你打出来的不是乱码,而网页中出现了乱码,绝大部分原因就出在了编码上了.此外除了乱码之外,还会出现一些其他问题(例如:IE6 的 CSS 加载问题)等等.潜行者m 写出本文的目的,就是要彻底解释清楚这个编码问题!如果你遇到了类似的问题,那就要仔细的看看这篇文章. ANSI.GBK.GB2312.U

    utf 8, gb2312, gbk, gb18030, unicode, ansi, 编码October 29

  • [Linux] 批量转换整个目录下的文件编码为UTF-8:

    [Linux] 批量转换整个目录下的文件编码为UTF-8: #!/bin/bash - #===============================================================================# # FILE: conv.sh# # USAGE: ./conv.sh # # DESCRIPTION: 一个支持把整个目录递归转换GB2312为UTF-8的脚本: # # OPTIONS: ---# REQUIREMENTS: Linux内核的操

    linux, 编码, 编码转换October 25

  • 一个关于编码的实验(C#写的记事本文档,在Linux下用C++读取)
    一个关于编码的实验(C#写的记事本文档,在Linux下用C++读取)

    第一步:用C#用各种类型的编码生成txt文档 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using System.IO; namespace WordTest { class Program { static void Main(string[] args) { string text1 = "wa jue

    编码October 13

  • 深入图解字符集与字符集编码(二)——编号 vs 编码
    深入图解字符集与字符集编码(二)——编号 vs 编码

    在深入研究字符集编码,简称编码之前,我们先引入一个概念:编号(code),引入它是为了更好地与编码(encode)相区分. 如果你对Unicode有深入了解,你也许已经意识到了Unicode中码点(code point)扮演的正是编号的角色.类似的还有GB系列中所谓的区位码. 其实叫什么并不重要,爱咋咋地,我并不关心.但乱叫容易叫混了,比如把码点也叫成Unicode编码,这里先把这些归入到编号概念.为区别起见,用黑色加粗的编码特指字符集编码. 到了后面你甚至会为字符集编码的边界在哪而困惑,为它的

    unicode, 编码, 字符集, 编号, 码点August 23

  • 深入图解字符集与字符集编码(一)——charset vs encoding
    深入图解字符集与字符集编码(一)——charset vs encoding

    许多时候,字符集与编码这两个概念常被混为一谈,但两者是有差别的,作为深入理解的第一步,首先要明确: 字符集与字符集编码是两个不同层面的概念 charset是character set的简写,即字符集. encoding是charset encoding的简写,即字符集编码,简称编码. 与接口及接口实现的对比 可以把这两者与接口及接口实现做个对比: 从这里可以很清楚地看到, 编码是依赖于字符集的,就像代码中的接口实现依赖于接口一样: 一个字符集可以有多个编码实现,就像一个接口可以有多个实现类一样.

    charset, unicode, Encoding, 编码, 字符集August 19

  • 最简单的基于FFMPEG的视频编码器(YUV编码为H.264)
    最简单的基于FFMPEG的视频编码器(YUV编码为H.264)

    本文介绍一个最简单的基于FFMPEG的视频编码器.该编码器实现了YUV420P的像素数据编码为H.264的压缩编码数据.编码器代码十分简单,但是每一行代码都很重要,适合好好研究一下.弄清楚了本代码也就基本弄清楚了FFMPEG的编码流程.目前我虽然已经调通了程序,但是还是有些地方没有完全搞明白,需要下一步继续探究然后补充内容. 本程序使用最新版的类库(编译时间为2014.5.6),开发平台为VC2010.所有的配置都已经做好,只需要运行就可以了. 下面直接上代码: /* *最简单的基于FFmpeg

    ffmpeg, h264, yuv, 视频, 编码August 16

  • 视频编码国家标准AVS与H.264的比较(节选)
    视频编码国家标准AVS与H.264的比较(节选)

    注:这个报告是官方报告,时间比较早了,AVS和H.264版本更新了很多,仅仅作为参考. 对视频编码标准进行客观评价的常用方法是峰值信噪比PSNR.表9.表10分别给出了AVS与MPEG-2标准以及AVS与MPEG-4 AVC/H.264标准main profile的客观编码性能.结果为相同码率条件下峰值信噪比PSNR的增益.可以看出,AVS相对于MPEG-2标准编码效率平均提高2.56dB,相比于H.264标准编码效率略低,平均有0.11dB的损失. 下面是另一组视频序列的AVS和H.264的性

    h 264, 视频, 编码, 比较, avsAugust 16

  • [总结]视音频编解码技术零基础学习方法
    [总结]视音频编解码技术零基础学习方法

    一直想把视音频编解码技术做一个简单的总结,可是苦于时间不充裕,一直没能完成.今天有着很大的空闲,终于可以总结一个有关视音频技术的入门教程,可以方便更多的人学习从零开始学习视音频技术.需要注意的是,本文所说的视音频技术,指的是理论层面的视音频技术,并不涉及到编程相关的东西. 0. 生活中的视音频技术 平时我们打开电脑中自己存电影的目录的话,一般都会如下图所示,一大堆五花八门的电影.(其实专业的影视爱好者一概会把影视文件分门别类的,但我比较懒,一股脑把电影放在了一起) 因为下载的来源不同,这些电影文

    网络, 视频, 总结, 编码, 音频August 16

  • 深入了解 VP8
    深入了解 VP8

    部分翻译:http://x264dev.multimedia.cx/?p=377 译者:delectate 问题一:vp8到底怎么样? 难道他真的比x264拥有更高的压缩比率,是个优秀的编码器吗?他真的比h264优秀吗?似乎On2自己都羞于承认-拿vp7举例,On2宣称vp7比h264快15%,但事实是编码视频速度既不快,视频质量也不高.On2曾经把vp3开源,似乎想借助社区的力量debug,最终theora上当--他们花了6年时间,结果做出来的还是个鸡肋-- 问题二:vp8真的没有专利问题吗?

    h 264, 对比, 编码, 滤波, VP8August 16

  • x265 (HEVC编码器,基于x264) 介绍
    x265 (HEVC编码器,基于x264) 介绍

    x265要出来了.简单翻译了一下项目网站首页的介绍. x265是一个开源项目,是一个将视频编码为h.265/高效率的视频编码(HEVC)格式的免费的库,在GNU GPL条款下发布. 它的源代码是免费提供个人或私人使用的. 项目目标 基于x264编码器(公认的最高质量的H.264编码器的实现)创造世界上最好的HEVC(h.265)视频编码器 -在任何给定的比特率提供尽可能高的视频质量 -在给定质量水平的情况下提供最低的比特率 提供世界上最高效的HEVC编码器 -在任何硬件配置上提供最高的编码和解码

    x264, 编码, 开源, HEVC, x265August 16

  • 主流视音频平台参数

    主流视音频平台参数,Wiki上的,包括世界上主流的视音频平台(YouTube,优酷等,很全), 包括视频的编码方式,分辨率,码率,播放器等等信息 http://en.wikipedia.org/wiki/Comparison_of_video_hosting_services 摘录一个表格部分内容如下(个人感觉信息有点偏老): Service Video Player Streaming Video Format Resolution Video bitrate (kbit) Audio bit

    wiki, 参数, 视频, 平台, 编码August 16

  • [总结]视频质量评价技术零基础学习方法
    [总结]视频质量评价技术零基础学习方法

    前段时间略忙,因此一直计划要总结的很多东西都没来得及写,这两天趁着空闲时间写上一篇.以后等时间充裕了再补充一些内容.本文总结一下学习视频质量评价技术的方法.视频质量评价是我研究生阶段主要的工作,包括发表的论文,毕业设计,进行的实验等等.在这一方面在国内做的研究并不是很多,因此我打算总结一下学习的经验,方便看过本文的人了解视频质量评价技术. 0.背景 首先应该了解一下质量评价都是干什么用的.这个其实本身也困扰了我一段时间.进入实验室之后,我也没有向师哥师姐咨询过这个问题.后来自己摸索了一段时间,大

    学习, 图像, 视频, 编码, 视频质量August 16

  • FFmpeg获取DirectShow设备数据(摄像头,录屏)
    FFmpeg获取DirectShow设备数据(摄像头,录屏)

    这两天研究了FFmpeg获取DirectShow设备数据的方法,在此简单记录一下以作备忘.本文所述的方法主要是对应Windows平台的. 1. 列设备 ffmpeg -list_devices true -f dshow -i dummy 命令执行后输出的结果如下(注:中文的设备会出现乱码的情况).列表显示设备的名称很重要,输入的时候都是使用"-f dshow -i video="{设备名}""的方式. 我自己的机器上列出了以下设备: [dshow @0388f5e

    ffmpeg, 编码, 录屏, 摄像头, directshowAugust 16

  • 最简单的基于FFMPEG的图像编码器(YUV编码为JPEG)
    最简单的基于FFMPEG的图像编码器(YUV编码为JPEG)

    伴随着毕业论文的完成,这两天终于腾出了空闲,又有时间搞搞FFMPEG的研究了.想着之前一直搞的都是FFMPEG解码方面的工作,很少涉及到FFMPEG编码方面的东西,于是打算研究一下FFMPEG的编码.在网上看了一些例子,发现要不然是难度略微有些大,要不然就是类库比较陈旧,于是就决定自己做一个编码方面的例子,方便以后学习. 本文的编码器实现了YUV420P的数据编码为JPEG图片.本着简单的原则,代码基本上精简到了极限.使用了2014年5月6号编译的最新的FFMPEG类库. 程序很简单,打开工程后

    ffmpeg, yuv, 图像, 编码, JPEGAugust 16

  • 使用FFmpeg类库实现YUV视频序列编码为视频

    搞视频处理的朋友肯定比较熟悉YUV视频序列,很多测试库提供的视频数据都是YUV视频序列,我们这里就用用YUV视频序列来做视频.关于YUV视频序列,我就不多讲了,可以看书学习,通常的视频序列都是YUV420格式的. 步骤也就那几步,添加视频流,打开编码器,开辟相应的内存空间,然后就可以打开YUV序列逐帧写入数据了,so easy!记得最后要做好文件的关闭和内存的释放,因为FFmpeg是c风格的(不知道新版本是否是c++风格的),这些工作都需要自己做好啊.过多的说明是没用的,直接上代码: 这里我补充

    ffmpeg, yuv, 类库, 视频, 编码August 16

  • 最简单的基于FFMPEG的音频编码器(PCM编码为AAC)

    本文介绍一个最简单的基于FFMPEG的音频编码器.该编码器实现了PCM音频采样数据编码为AAC的压缩编码数据.编码器代码十分简单,但是每一行代码都很重要.通过看本编码器的源代码,可以了解FFMPEG音频编码的流程. 本程序使用最新版的类库(编译时间为2014.5.6),开发平台为VC2010.所有的配置都已经做好,只需要运行就可以了. 下面直接上代码: /* *最简单的基于FFmpeg的音频编码器 *Simplest FFmpeg Audio Encoder * *雷霄骅 Lei Xiaohua

    aac, ffmpeg, pcm, 编码, 音频August 16

  • python学习--编码
    python学习--编码

    为了将各种不同的语言都包含在同一的字符集中,满足国际间的信息交流国际上制定了UNICODE字符集. 通过使用UNICODE字符集可以满足跨语言的文字处理,有效的避免乱码产生. 使用方法:在脚本中增加以下代码行之一 #-*- coding:utf-8 -*- #coding:utf-8 注意:如果是在命令行输出中文,则需要设定编码为cp936, 文件格式保存为utf-8编码 示例代码: #coding:utf-8 ch = '在中使用中文需要注意字符编码问题' print ch print ch.

    utf 8, python, unicode, 乱码, 编码August 10

  • Python&MySQL操作过程中遇到的编码问题

    对于Python字符编码的理解 之前整理了一部分,这次主要是设计到数据库操作的. 下面是一些编码方面的概念和原理,以条目方式整理: CREATE DATABASE IF NOT EXISTS db_name DEFAULT CHARSET utf8 COLLATE utf8_general_ci; DEFAULT CHARSET是设置默认字符编码集,也就是数据在库内从存储编码,我的理解是在存储这个层面上的,如果SQL命令是以gbk方式传输数据的(cur.execute('SET NAMES ut

    python, MySQL, 编码July 14

  • 4项技巧使你不再为PHP中文编码苦恼

    PHP程序设计中中文编码问题曾经困扰很多人,导致这个问题的原因其实很简单,每个国家(或区域)都规定了计算机信息交换用的字符编码集,如美国的扩展 ASCII 码,中国的 GB2312-80,日本的 JIS 等.作为该国家/区域内信息处理的基础,字符编码集起着统一编码的重要作用.字符编码集按长度分为 SBCS(单字节字符集),DBCS(双字节字符集)两大类.早期的软件(尤其是操作系统),为了解决本地字符信息的计算机处理,出现了各种本地化版本(L10N),为了区分,引进了 LANG, Codepage

    PHP, 中文, 编码July 4

  • PHP判断字符串编码函数mb_detect_encoding总结

    php中可以使用 mb_detect_encoding() 函数来判断字符串是什么编码的. 当在php中使用mb_detect_encoding函数进行编码识别时,很多人都碰到过识别编码有误的问题,例如对与GB2312和UTF-8,或者UTF-8和GBK(这里主要是对于cp936的判断),网上说是由于字符短时mb_detect_encoding会出现误判. 代码如下: $encode = mb_detect_encoding($keytitle, array("ASCII","

    PHP, 判断, 字符串, 编码, mb_detect_encodingJune 19

  • Html5 FileReader 对文件进行Base64编码
    Html5 FileReader 对文件进行Base64编码

    以Base64进行编码的数据Url开始越来越广泛的被应用起来,原来做Base64转换要自己写一个小程序来转,其实Html5的FileReader的readAsDataURL方法读取出的数据就已经是Base64数据格式的Url了,利用FileReader实现一个对本地文件进行读取并且转换为Base64 Url的页面也非常简单. 页面地址: http://zhangsichu.com/html5/filereader/base64dataurl.htm 最近IPhone比较火,这里用IPhone做了

    filereader, 文件, 编码, 职场, 休闲June 11

  • ASCII.unicode.utf-8编码规则
    ASCII.unicode.utf-8编码规则

    1. ASCII码 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte).也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111. 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定.这被称为ASCII码,一直沿用至今. ASCII码一共规定了128个字符的编码

    编码May 29

  • 使用juniversalchardet做字符编码识别

    在抓取网站的页面的时候最烦人的一件事情之一就是识别原站点的编码,通常来说只有GBK(GB2312)和UTF8两种,不过依旧需要读取大量Http头信息来识别,有些网站则由于历史原因两种编码同时存在,导致抓取中的一些问题.于是苦苦寻找,终于找到神器juniversalchardet. 首先引包 <!-- Mozilla的编码识别包 --> <dependency> <groupId>com.googlecode.juniversalchardet</groupId&g

    Java, 编码, juniversalchardet, jchardetMay 12

  • 对于Python字符编码的理解

    首先请理解这句话:对于Python的内建函数encode()和decode()来说,它都是针对字符在内存中(用终端所处理字符的内存表示)介于Unicode与指定编码之间的转换. 示例一: s = '汉字' # shell终端编码为UTF-8,则s是UTF-8编码的字符 s.decode("UTF-8") # 将s通过UTF-8进行解码,得到u'\u6c49\u5b57' # 而对于u'\u6c49\u5b57'的Unicode编码内容,可以通过以下方式再次编码成UTF-8.GBK或者其

    python, 字符, 编码May 10

  • 关于Java字符编码几个容易弄错的问题

    USC-2和UTF-16之间的区别? 都是Unicode编码方案的具体实现,UTF-16是USC-2的父集,USC-2只能支持2个字节的编码,超过2个字节的编码需要用UTF-16. Java里面一个char类型变量占用多少内存? Java内置的字符编码实现方式是UTF-16,对于在2个字节编码范围内(USC-2)的字符,用一个char表示:对于超过2个字节编码范围的字符,用两个char表示.但不论怎样,一个char占用的内存大小都是2个字节. String.getBytes(), String.

    Java, 编码April 4

  • java字符串的各种编码转换

    import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符,也叫作ISO646-US.Unicode字符集的基本拉丁块 */ public static final String US_ASCII = "US-ASCII"; /** ISO 拉丁字母表 No.1,也叫作 ISO-LATIN-1 */ public static fina

    utf 8, gbk, Java, 编码, 字符编码March 12

  • HttpClient Post/GetMethod 转码方案汇总

    HttpClient Post 方式模拟请求时常会遇到中文转码问题,这里我总结一下自己遇到的几种情况和解决方案. 1.请求网页 GetMethod getMethod = new GetMethod("http://www.baidu.com"); //(1).这里可以设置自己想要的编码格式 getMethod.getParams().setContentCharset("GB2312"); //(2).对于get方法也可以这样设置 getMethod.getPar

    httpclient, post, get, 乱码, 编码February 21

  • JavaScript: 详解Base64编码和解码
    JavaScript: 详解Base64编码和解码

    Base64是最常用的编码之一,比如开发中用于传递参数.现代浏览器中的<img />标签直接通过Base64字符串来渲染图片以及用于邮件中等等.Base64编码在RFC2045中定义,它被定义为:Base64内容传送编码被设计用来把任意序列的8位字节描述为一种不易被人直接识别的形式. 我们知道,任何数据在计算机中都是以二进制的方式存储的.一个字节为8位,一个字符在计算机中存储为一个或多个字节,比如英文字母.数字以及英文标点符号就是用一个 字节来存储的,通常称为ASCII码.而简体中文.繁体中文

    utf8, unicode, base64, JavaScript, 编码, UTF16February 19

  • 中文编码杂谈(转)
    中文编码杂谈(转)

    编码问题的例子 在windows自带的notepad(记事本)程序中输入"联通"两个字,保存后再次打开,会发现"联通"不见了,代之以"��ͨ"的乱码.这是windows平台上典型的中文编码问题.即文件保存的时候是按照ANSI编码(其实就是GB2312,后面会详细介绍)保存,打开的时候程序按照UTF-8方式对内容解释,于是就出现了乱码.避免乱码的方式很简单,在"文件"菜单中选择"打开"命令,选择保存的文件,然

    utf8, 编码, UTF16, utf32February 13

  • "文本"在计算机中的本质含义

    对于计算机,有许许多多的疑惑.其中一个是:我们常常提到的"文本",究竟是指什么?我们常常说,打开一个文本文件,或者打开一个pdf文件等等,他们都可以称呼为:文本文件.然而,在计算机中,什么是文本? 计算机中的文本,它不是书本,或者日记本上的字体,而是一种形象的称呼,本质上是电子信号. 对于这个概念,必须要知道一件事情:信息编码.计算机中,所有信息都是编码,使用二进制进行编码.所谓编程,就是将思维编码.从这个编码角度,计算机没有任何关于人类所了解的事物,比如正负.它仅仅知道编码.那么,这

    文本, 编码, 计算机文本, 电子信号February 12

  • 空格trim不掉问题解决思路

    本文地址:http://my.codeweblog.com/fffddgx/blog/196376 编码规则 处理这个问题的理论基础是对编码的理解,对于不同编码的理解也是作为一个码农必备的素质,推荐几篇好文章,读后应该就对编码规则进化了然于胸了,急性子.姿势渊博码农略过. 字符编解码的故事(ASCII,ANSI,Unicode,Utf-8区别) 关于字符编码,你所需要知道的 字符集和字符编码(Charset & Encoding) (可以这样理解:Unicode是字符集,UTF-32/ UTF-

    PHP, 空白字符, trim, 编码January 27

  • 日常工作小结(三)

    1. 唯一性索引 在维护项目A数据库的时候,发现有几张表的设计比较相似,如: id userId username ... 其中id做为自增长主键,并无任何业务意义.而userId是业务系统根据业务需要生成系统唯一的逻辑id.但是再看系统该表并没有为该字段添加unique约束.虽然业务上可以保证该字段不会出现重复值,但是发现业务处理上很多查询都是以该字段做为搜索条件,所以有没有unique就显得比较重要了.因为在Mysql数据库中,unique约束的字段会自动添加唯一性索引,这样在数据量比较大的

    索引, 编码January 2

  • php函数mult_iconv:对任意维数组转换字符编码(iconv)

    php的iconv函数只支持对字符串的转换编码,如果是数组,就要自己遍历转换了,因此写如上的函数,对任意维数组进行转换,同时转换下标(索引)及值. 注意:不转对象. function mult_iconv($in_charset,$out_charset,$data) { if(substr($out_charset,-8)=='//IGNORE'){ $out_charset=substr($out_charset,0,-8); } if(is_array($data)){ foreach($

    iconv, PHP, 转换, 编码November 14

  • 关于base64编码和解码

    最近在项目中遇到base64解码的问题,在百度里面搜索一下,发现很多方法.下面转载洞庭散人的一篇博文以作小节.博文地址:http://www.cnblogs.com/phinecos/archive/2008/10/10/1308272.html ZBase64.h文件 #include <string> using namespace std; class ZBase64 { public: /*编码 DataByte [in]输入的数据长度,以字节为单位 */ string Encode(

    base64, 编码, 解码November 3

  • 字符编码扫盲

    首先明确,所有你看到的听到的,在计算中都是[0|1]的有限次排列组合 一个[0|1]位bit,8位[0|1]为节byte,2节16位为字word 概念个人总结 字符集:人类社会交流语言的文字表达,每个社会都有其记载象形方式,西文国家用英文(26个字母+符号),天朝 用 汉字(拼音字母+字典中的汉字+其他少数名族的字+....).每种人类语言文字的集合就是字符集吧. 字符集的 "编码",是指对某种人类语言文字字符的信息化方式,你也可以自己制定一套:一个计算机信息实体唯一对应到一个文字字符

    unicode, 编码, uft-8, UTF-16, UTF-32October 22

  • Mac OS下android真机调试过程

    昨天费了一天时间来熟悉苹果电脑,因为最近工作重心转移到Mac电脑上,所以要让eclipse中的工程能够和家里的eclipse同步. 为了能够兼顾到开发iPhone软件,将苹果系统升级到最新的10.8.5,并在appstore中将xcode更新到最新的5.0,这样iPhone开发环境就OK了. 接着开始捣鼓android开发环境,坑爹的appstore里面没有eclipse,只能去官网下载.为了省事,我直接去谷歌官网下载了ADT使用,并将jdk更新到了1.7,接下去,登陆云服务器,搭建了SVN,用

    eclipse, android, adb, 编码October 18

  • 字符集,字体,编码,代码页,输入法

    前言 0) . 计算机中的信息包括数据信息和控制信息,数据信息又可分为数值和非数值信息.非数值信息和控制信息包括了字母.各种控制符号.图形符号等,它们都以二进制编码方式存入计算机并得以处理,这种对字母和符号进行编码的 二进制代码称为字符代码(Character Code).计算机中常用的字符编码有ASCII码(美国标准信息交换码)和EBCDIC码(扩展的BCD交换码). 1) .(Unicode与UCS)历史上有两个独立的创立单一字符集的组织:一个是国际标准化组织ISO开展了 ISO/IEC 1

    输入法, 编码, 字体, 字符集, 代码页October 13

  • /bin/bash^M: bad interpreter: 没有那个文件或目录

    运行脚本时出现了这样一个错误,打开之后并没有找到所谓的^M,查了之后才知道原来是文件格式的问题,也就是linux和windows之间的不完全兼容... 用以下语句就可以搞定 vi test.sh :set fileformat=unix :wq

    linux, 编码October 10