通过node.js保存emoji到mysql

2017-07-17 14:48:20

什么是emoji


emoji在诞生之初有多种标准,所以早期兼容性是个问题。但是现在已经标准化了,是unicode的一部分。可以认为,跟字母、汉字一样,emoji就是unicode中一个普通的字符

但是emoji通过utf-8编码后,每个字符占4个字节,属于宽字符。而老版本的mysql只支持一个字符占3个字节,所以老版本的mysql是无法存储emoji的。新版本的mysql增加了字符集utf8mb4,可以支持单字符最多占4个字节。utf8mb4是utf8的超集,可以无需修改地支持原来的utf8字符

要让mysql存储emoji,需要满足2个条件:

1、mysql的charset设置为utf8mb4

2、客户端连接mysql的驱动,也需要设置为utf8mb4


比如:

var pool = mysql.createPool({
  connectionLimit: 10,
  host: "122.42.7.135",
  user: "root",
  password: "D@",
  database: "ling",
  useConnectionPooling: true,
  charset:"utf8mb4",
});

mysql设置charset为utf8mb4

1、需要设置数据库实例的character_set_server参数为UTF8mb4

2、设置数据库字符集为utf8mb4

3、设置表的字符集为UTF8mb4

4、如果不设置表的字符集为UTF8mb4,也可以设置单独某个列的字符集为UTF8mb4

对于新开发的应用,建议都把数据库的字符集设置为UTF8mb4,以免后期迁移的麻烦

客户端连接mysql驱动

以node.js为例,需要设置charset参数为UTF8MB4_GENERAL_CI,全大写

其他平台如java,php,也需要做类似的配置

至于最终呈现的地方,包括html页面、iOS客户端,经实验发现,不需要特殊的设置,自然可以输入和展示emoji字符

不支持emoji的客户端

有些客户端不支持emoji,或者支持得不充分。我实验了一下:

navicat for mysql完全无法正确展示已经入库的emoji字符

webstorm也无法完全正确展示,部分emoji字符被截断而展示不全

CocoaRestClient可以完美展示,借助复制粘贴,也可以输入emoji字符


  • 2017-01-16 15:09:40

    Javascript模块化编程(一):模块的写法

    随着网站逐渐变成"互联网应用程序",嵌入网页的Javascript代码越来越庞大,越来越复杂。网页越来越像桌面程序,需要一个团队分工协作、进度管理、单元测试等等......开发者不得不使用软件工程的方法,管理网页的业务逻辑。

  • 2017-01-16 15:16:24

    Javascript模块化编程(二):AMD规范

    AMD是"Asynchronous Module Definition"的缩写,意思就是"异步模块定义"。它采用异步方式加载模块,模块的加载不影响它后面语句的运行。所有依赖这个模块的语句,都定义在一个回调函数中,等到加载完成之后,这个回调函数才会运行。

  • 2017-01-16 15:19:24

    RequireJS 入门指南

    如今最常用的JavaScript库之一是RequireJS。最近我参与的每个项目,都用到了RequireJS,或者是我向它们推荐了增加RequireJS。在这篇文章中,我将描述RequireJS是什么,以及它的一些基础场景。

  • 2017-01-16 15:22:30

    CommonJS规范

    CommonJS模块规范。 根据这个规范,每个文件就是一个模块,有自己的作用域。在一个文件里面定义的变量、函数、类,都是私有的,对其他文件不可见。

  • 2017-01-17 15:42:03

    vue-cli 发布(译)

    当我们真正开发一个应用的时候,我们不可避免的会用到一大堆的工具,模块化、预处理器、热模块加载、代码校验和测试。这些工具对于一个需要长期维护的大型应用是必须的,但是项目初始化将会是让人痛苦的事情。这就是为什么我们做了 vue-cli 。