ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

Qt读取文件乱码

2022-05-20 23:33:40  阅读:146  来源: 互联网

标签:字符 UTF Qt toText GBK 乱码 Unicode ASCII 读取


转载来自:https://blog.csdn.net/huang1600301017/article/details/121174229

编码问题回顾和总结:
GB2312 :是对 ASCII 的中文扩展。兼容ASCII;
GBK: 包括了 GB2312 的所有内容,同时又增加了近20000个新的汉字(包括繁体字)和符号;
GB18030:在GBK基础上加入少数民族的几千个新字,扩展成GB18030;
Unicode:所有的字符被一视同仁,汉字不再使用“两个扩展ASCII”,而是使用“1个Unicode”,注意,现在的汉字是“一个字符”了,于是,拆字、统计字数这些问题也就自然而然的解决了。但是,这个世界不是理想的,不可能在一夜之间所有的系统都使用Unicode来处理字符,所以Unicode在诞生之日,就必须考虑一个严峻的问题:和ASCII字符集之间的不兼容问题。
我们知道,ASCII字符是单个字节的,比如“A”的ASCII是65。而Unicode是双字节的,比如“A”的Unicode是0065,这就造成了一个非常大的问题:以前处理ASCII的那套机制不能被用来处理Unicode了。
另一个更加严重的问题是,C语言使用'\0'作为字符串结尾,而Unicode里恰恰有很多字符都有一个字节为0,这样一来,C语言的字符串函数将无法正常处理Unicode,除非把世界上所有用C写的程序以及他们所用的函数库全部换掉。
于是,比Unicode更伟大的东东诞生了,之所以说它更伟大是因为它让Unicode不再存在于纸上,而是真实的存在于我们大家的电脑中。那就是:UTF。
UTF= UCS Transformation Format,即UCS转换(传输)格式。
它是将Unicode编码规则和计算机的实际编码对应起来的一个规则。现在流行的UTF有2种:UTF-8和UTF-16。
这两种都是Unicode的编码实现。 

    QFile file("2.txt");
    if(!file.open(QIODevice::ReadOnly | QIODevice::Text)) {
        return false;
    }
 
    QTextStream toText(&file);
    toText.setCodec("GBK");//设置文件流编码方式
    //QString str = toText.readAll().trimmed();
    while(!toText.atEnd()) {
        QString str = toText.readLine().trimmed();
        qDebug() << "str = " << str;
    }

 

 

标签:字符,UTF,Qt,toText,GBK,乱码,Unicode,ASCII,读取
来源: https://www.cnblogs.com/Galesaur-wcy/p/16294024.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有