随便想到,群聊天的数据库简单设计

2020-03-20 13:35:55

参考地址 随便想到,群聊天的数据库简单设计


简单来讲,就是记录最后的阅读id,这样通过数据库查询。

顺便说一下,群记录可以这样。

个人都个人的,就是每次发送给对方信息,就往未读信息表里面插入一条数据,当然这个数据之插入messageid,每次客户端收到长连接请求,就去拉去这个表里面的所有未读记录。客户端根据内容进行读取。

通过查询,发现微信只保留未读信息为两天。这样的话,数据量不多的话,完全群聊信息,完全也可以这么做。

其次,我觉得我们如果用户量不大的话,完全可以保留更多的天数。

为了更加保障信息不丢失,我们可以添加历史信息的功能。

1,聊天消息设计


突然想了想,如果一个群聊天数据库到底应该咋设计。
从最简单的思路慢慢开始。简单到大家都能明白。

2,就一个表


最简单的方式,先完成功能。开发比较着急嘛,一个表数据存放方便。
数据库表结构如下。

 CREATE TABLE `msg` (  `id` bigint(20) NOT NULL AUTO_INCREMENT,  `gid` bigint(20) DEFAULT NULL,  `from_uid` bigint(20) DEFAULT NULL,  `to_uid` bigint(20) DEFAULT NULL,  `content` text DEFAULT NULL,  `is_read` tinyint(1) DEFAULT '0',  `create_time` datetime DEFAULT NULL,  `update_time` datetime DEFAULT NULL,  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

一个群的聊天记录,一个消息发给多个人,每个人都收到一个相同的消息。
一般是不会这样设计的吧。这个数据 比较冗余啊。而且一个群下面人越多。
消息的重复数量越多。m*n条数据冗余啊

3,简化下


拆分成消息内容和流水表。

 CREATE TABLE `msg` (  `id` bigint(20) NOT NULL AUTO_INCREMENT,  `content` text DEFAULT NULL,  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

 CREATE TABLE `msg_log` (  `id` bigint(20) NOT NULL AUTO_INCREMENT,  `gid` bigint(20) DEFAULT NULL,  `msg_id` bigint(20) DEFAULT NULL,  `from_uid` bigint(20) DEFAULT NULL,  `to_uid` bigint(20) DEFAULT NULL,  `is_read` tinyint(1) DEFAULT '0',  `create_time` datetime DEFAULT NULL,  `update_time` datetime DEFAULT NULL,  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

这样会好一点,将消息内容存储成一个表,然后每个人都只有一个流水表。
但是这样也有一个问题,只是节省了内容字段。没有节省流水。
还是 m*n 条消息记录呢

4,增加配置表


拆分成两个表,一个是消息的流水表,一个是每个人的配置表。
记录每个群下面的这个用户的最后读取的消息last_msg_id,然后在计算消息未读数据。
这样优化之后数据将减少好多,数量是 m+n条数据。不在是成倍增长了。

 CREATE TABLE `msg` (  `id` bigint(20) NOT NULL AUTO_INCREMENT,  `gid` bigint(20) DEFAULT NULL,  `content` text DEFAULT NULL,  `create_time` datetime DEFAULT NULL,  `update_time` datetime DEFAULT NULL,  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

 CREATE TABLE `msg_config` (  `id` bigint(20) NOT NULL AUTO_INCREMENT,  `gid` bigint(20) DEFAULT NULL,  `last_msg_id` bigint(20) DEFAULT NULL,  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

但是这个是个局限只限于群聊天,因为这个只是知道你这个群的未读消息数量。
所以直接进行connt查询就行。

4,总结


总结,一个群消息的数据设计简单的进行了几次演化。
最后的方案比较好,只有通过配置读取最新的msg_id,然后再计算出用户未读数量。
基本上一个消息都是顺序读取的,一个流水,可以认为用户也是顺着读的。
这样就可以把消息的未读数据用last_msg_id 进行计算。
感觉上qq上面的群消息应该也是这样设计的吧。这样设计才最节省资源。


  • 2019-08-07 17:16:53

    如何在 Node.js 中使用 import / export 的三种方法

    因为一些历史原因,虽然 Node.js 已经实现了 99% 的 ES6 新特性,不过截止 2018.8.10,How To Enable ES6 Imports in Node.JS 仍然是老大难问题,下面我来介绍三种方法可以让我们在 Node.js 中使用 import/export 。

  • 2019-08-13 08:56:46

    nuxtjs组合element

    添加elementUI 插件,plugins->ele.js,代码如下

  • 2019-08-13 20:06:42

    修改 Nginx 进程最大可打开文件数(worker_processes和worker_connections)

    worker_processes:操作系统启动多少个工作进程运行Nginx。注意是工作进程,不是有多少个nginx工程。在Nginx运行的时候,会启动两种进程,一种是主进程master process;一种是工作进程worker process。例如我在配置文件中将worker_processes设置为4,启动Nginx后,使用进程查看命令观察名字叫做nginx的进程信息,我会看到如下结果:

  • 2019-08-14 09:01:18

    linux下高并发服务器实现

    在做网络服务的时候tcp并发服务端程序的编写必不可少。tcp并发通常有几种固定的设计模式套路,他们各有优点,也各有应用之处。下面就简单的讨论下这几种模式的差异:

  • 2019-08-14 13:18:59

    Linux系统下CPU使用(load average)梳理

    在平时的运维工作中,当一台服务器的性能出现问题时,通常会去看当前的CPU使用情况,尤其是看下CPU的负载情况(load average)。对一般的系统来说,根据cpu数量去判断。比如有2颗cup的机器。如果平均负载始终在1.2以下,那么基本不会出现cpu不够用的情况。也就是Load平均要小于Cpu的数量。

  • 2019-08-14 14:27:35

    计算密集型和IO密集型

    在进行I/O操作的时候,是将任务交给DMA来处理,请求发出后CPU就不管了,在DMA处理完后通过中断通知CPU处理完成了。I/O操作消耗的cpu时间很少.

  • 2019-08-14 14:29:12

    浅谈nodejs和php

    现在,Web开发公司和开发人员可以选择多种技术栈来构建Web应用程序。早期网络发展,不同的技术被用于前端和后端开发。但是,随着Node.js的发布,布局发生了变化,因为它允许开发人员使用 JavaScript 编写后端代码。这最终催生了MEAN(MongoDB + Express +AngularJS + NodeJS )堆栈 web 开发框架,从前端到后端甚至是数据库(MongoDB -JSON)都使用 JavaScript。在 Node.js 之前,Web 开发通常是在 PHP 的帮助下完成的,因为它很容易与 HTML 集成,帮助开发人员立即构建动态网站。在这篇文章中,我们将比较 Node.js 和 PHP,看哪一个最适合当前的行业需求。