django 多数据库及分库实现方式
定义及路由机制
定义
在settings里面的DATABASES是一个字典,用于定义需要的数据库,如下,一共定义了两个数据库。
DATABASES = { 'default': { 'NAME': 'app_data', 'ENGINE': 'django.db.backends.postgresql_psycopg2', 'USER': 'postgres_user', 'PASSWORD': 's3krit' }, 'user1': { 'NAME': 'user1_data', 'ENGINE': 'django.db.backends.mysql', 'USER': 'mysql_user', 'PASSWORD': 'priv4te' } 'user2': { 'NAME': 'user2_data', 'ENGINE': 'django.db.backends.mysql', 'USER': 'mysql_user', 'PASSWORD': 'priv4te' } }
那么什么时候调用default什么时候调用users数据库呢,这就需要下面的路由。
路由注册
class User1Router(object): """ A router to control all database operations on models in the auth application. """ def db_for_read(self, model, **hints): """ Attempts to read auth models go to auth_db. """ if model._meta.app_label == 'auth': return 'user1' return None def db_for_write(self, model, **hints): """ Attempts to write auth models go to auth_db. """ if model._meta.app_label == 'auth': return 'user1' return None def allow_relation(self, obj1, obj2, **hints): """ Allow relations if a model in the auth app is involved. """ if obj1._meta.app_label == 'auth' or obj2._meta.app_label == 'auth': return True return None def allow_syncdb(self, db, model): """ Make sure the auth app only appears in the 'auth_db' database. """ if db == 'auth_db': return model._meta.app_label == 'auth' elif model._meta.app_label == 'user1': return False return None class User2Router(object): """ A router to control all database operations on models in the auth application. """ def db_for_read(self, model, **hints): """ Attempts to read auth models go to auth_db. """ if model._meta.app_label == 'auth2': return 'user2' return None def db_for_write(self, model, **hints): """ Attempts to write auth models go to auth_db. """ if model._meta.app_label == 'auth2': return 'user2' return None def allow_relation(self, obj1, obj2, **hints): """ Allow relations if a model in the auth app is involved. """ if obj1._meta.app_label == 'auth' or obj2._meta.app_label == 'auth': return True return None def allow_syncdb(self, db, model): """ Make sure the auth app only appears in the 'auth_db' database. """ if db == 'auth_db': return model._meta.app_label == 'auth2' elif model._meta.app_label == 'user2': return False return None
User1Router的路由逻辑是,如果model所属的app是auth的话,就使用user1数据库,否则就使用其他的;User2Router的逻辑类似。
如何注册路由
光定义路由程序无法调用到,还需要注册到django中,在settings中定义
DATABASE_ROUTERS = ['path.to.User1Router' , 'path.to.User2Router']
path.to:是User1Router的完整python包路径,所以,User1Router不一定要在settings中实现,可以在任何地方。
路由机制
那么django是如何选择其中一个路由的呢?
1. django按照注册的顺序轮询DATABASE_ROUTERS,所以首先验证User1Router是否返回了非空字符串,如果是,则使用User1Router;如果不是则接着验证后面的Router;
2. 同样验证User2Router,如果User2Router返回了非空字符串,则使用User2Router;如果不是则使用default数据库;
3. 所以可以看出,路由注册的顺序是会影响最后的结果的,注册在前面的路由会优先被使用;
自动路由和手动路由
上面定义的Router是自动路由,意思是django会自动轮询所注册的路由器,某个model会保存在哪个数据库,是django通过注册的Router自动获得的,在编码中你不需要指定;
手动路由,则是你可以在编码中指定某个model要保存到哪个数据库。
而且手动路由也有性能方面的优点,如果定义了很多个数据库,每次保存或者读取model都要把轮询一遍路由列表,显然效率有些低,如果程序逻辑清楚的知道当前的代码应该连接哪个数据库,显示指定的方式显然效率更高。
手动路由
查询
使用using函数,参数就是要查询的数据库
User.objects.using('user1').all()
保存或者更新
使用save的using参数,值就是要使用的数据库
> my_object.save(using='user1')
删除
使用delete的using参数
> user_obj.delete(using='user1')
分库技术
下面紧紧介绍分库的思路。
垂直分库
即一个app对应一个数据库,上面自动路由的例子就是一个垂直分库的例子,auth1使用user1数据库,auth2使用user2数据库。当然也可以使用手动路由。
水平分库
水平分库建议使用手动路由,因为每个model的分库机制可能都不一样,自动路由实现起来有些麻烦会造成性能不高,而手动路由,每个model根据自己的规则来获得不同的数据库。
补充知识:Django实现数据库读写分离、一主多从、分库
读写分离
在工程中,通常需要实现mysql读写分离。在Django中需要支持读写分离的话,只需要很简单的几步就可以了。
首先,配置读库和写库。
在django项目的settings.py中,配置读库和写库。
DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': 'WIPS', 'USER': 'mysql', 'PASSWORD': '360tianxun#^)Sec', 'HOST': '', 'PORT': '', }, 'slave': { 'ENGINE': 'django.db.backends.mysql', 'NAME': 'TEST', 'USER': 'mysql', 'PASSWORD': '360tianxun#^)Sec', 'HOST': '', 'PORT': '', }, }
接下来,需要创建数据库的路由分发类。
可以在appname/utils下创建一个db_router.py文件,在文件中定义db_router类。类中实现读库写库的选择。
class DBRouter(object): def db_for_read(self, model, **hints): return "slave" def db_for_write(self, model, **hints): return "default" def allow_relation(self, obj1, obj2, **hints): return True
最后,在settings.py中添加路由配置。
DATABASE_ROUTERS = ['appname.utils.db_router.DBRouter' ]
重新启动Django就完成了。
这里需要注意的是,Django只完成了读写分离,但mysql主库、从库的同步操作并不归django负责,依然需要mysql实现。
一主多从
一主多从的方案在实际应用中是更常见的配置。在上面配置的基础上,只需要修改几个地方,就可以实现一主多从了。
首先,修改settings.py,增加全部从库的设置。
其次,修改db_router类中db_for_read(),下面是随机选取读库的例子。也可以根据实际的需要,选取不同的调度算法。
class DBRouter(object): def db_for_read(self, model, **hints): import random return random.choice(['slave', 'slave2', 'slave3'])
分库
当需要不同的app使用不同的库时,可以利用model中的app_label来实现db的路由。
class DBRouter(object): def db_for_read(self, model, **hints): if model._meta.app_label == 'app01': import random return random.choice(['app01_slave1', 'app01_slave2', 'app01_slave3']) if model._meta.app_label == 'app02': return "app02_slave"
按照上面的操作就很容易实现mysql的读写分离、一主多从和分库了。但这个方法只建议用在小项目上。
以上这篇django 多数据库及分库实现方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
下一篇:Python自动重新加载模块详解(autoreload module)