通过node.js保存emoji到mysql

2017-07-17 14:48:20

什么是emoji


emoji在诞生之初有多种标准,所以早期兼容性是个问题。但是现在已经标准化了,是unicode的一部分。可以认为,跟字母、汉字一样,emoji就是unicode中一个普通的字符

但是emoji通过utf-8编码后,每个字符占4个字节,属于宽字符。而老版本的mysql只支持一个字符占3个字节,所以老版本的mysql是无法存储emoji的。新版本的mysql增加了字符集utf8mb4,可以支持单字符最多占4个字节。utf8mb4是utf8的超集,可以无需修改地支持原来的utf8字符

要让mysql存储emoji,需要满足2个条件:

1、mysql的charset设置为utf8mb4

2、客户端连接mysql的驱动,也需要设置为utf8mb4


比如:

var pool = mysql.createPool({
  connectionLimit: 10,
  host: "122.42.7.135",
  user: "root",
  password: "D@",
  database: "ling",
  useConnectionPooling: true,
  charset:"utf8mb4",
});

mysql设置charset为utf8mb4

1、需要设置数据库实例的character_set_server参数为UTF8mb4

2、设置数据库字符集为utf8mb4

3、设置表的字符集为UTF8mb4

4、如果不设置表的字符集为UTF8mb4,也可以设置单独某个列的字符集为UTF8mb4

对于新开发的应用,建议都把数据库的字符集设置为UTF8mb4,以免后期迁移的麻烦

客户端连接mysql驱动

以node.js为例,需要设置charset参数为UTF8MB4_GENERAL_CI,全大写

其他平台如java,php,也需要做类似的配置

至于最终呈现的地方,包括html页面、iOS客户端,经实验发现,不需要特殊的设置,自然可以输入和展示emoji字符

不支持emoji的客户端

有些客户端不支持emoji,或者支持得不充分。我实验了一下:

navicat for mysql完全无法正确展示已经入库的emoji字符

webstorm也无法完全正确展示,部分emoji字符被截断而展示不全

CocoaRestClient可以完美展示,借助复制粘贴,也可以输入emoji字符


  • 2018-01-29 15:18:57

    Druid多数据源配置

    搞了一天,竟然输在了把datasource,携程dataSource.老是切换不成功,几近崩溃。

  • 2018-02-01 22:09:18

    给linux添加回收站

    linux下常常使用rm,导致误操作删除一些重要的文档,很难恢复(当然也能恢复,不过比较复杂),所以在这种情况下,我们如果能给linux添加一个回收站就好多了,说白了,这个回收站机制也比较简单,就是使用 mv封装一个rm,简单的可以自己写个脚本,复杂点的就是在bin下添加这个封装命令就行了。

  • 2018-02-02 10:52:50

    IntelliJ IDEA 快捷键说明大全(中英对照、带图示详解)

    因为觉得网络上的 idea 快捷键不够详尽,所以特别编写了此篇文章,方便大家使用 idea O(∩_∩)O~ 其中的英文说明来自于 idea 的官网资料,中文说明主要来自于自己的领会和理解,英文说明只是作为参考。重要的快捷键会附带图示,进行详细的说明。

  • 2018-02-02 15:19:29

    贝塞尔曲线扫盲

    相信很多同学都知道“贝塞尔曲线”这个词,我们在很多地方都能经常看到。但是,可能并不是每位同学都清楚地知道,到底什么是“贝塞尔曲线”,又是什么特点让它有这么高的知名度。