2015第15周日PostgreSQL学习

时间:2023-03-09 17:44:54
2015第15周日PostgreSQL学习

英文版官网地址:http://www.postgresql.org/

上面显示的最新版本信息是PostgreSQL 9.4.1, 9.3.6, 9.2.10, 9.1.15 & 9.0.19 Released!
中文版社区地址:http://www.postgres.cn/home
显示2014/12/18: 全球开发组宣布业界领先的开源关系数据库PostgreSQL9.4版发布,这个版本新增了许多的功能,来适应不同的数据库用户灵活性、可伸缩性和性能提升的要求,包括对JSON 数据的支持改进,增强了复制和索引的性能
  • 功能
    • PostgreSQL 拥有大型商用数据库最多的功能,例如:事务,子查询,触发器,视图,外键参考完整性和复杂的锁定等。 我们还有一些它们没有的特性,如用户定义类型,继承,规则和多版本并行控制以减少锁的争用等。
  • 性能
    • PostgreSQL和其他商用或开源的数据库具有类似的性能。对某些数据处理快一些,对其他一些处理慢一些。 与其他数据库相比,我们的性能优劣通常在 +/- 10%之间。
  • 可靠性
    • 我们都知道数据库必须是可靠的,否则它就一点用都没有。我们努力做到发布经过认真测试的,缺陷最少的稳定代码。每个版本至少有一个月的 beta 测试时间,并且我们的发布历史显示我们可以提供稳定的,牢固的,可用于生产使用的版本。我们相信在这方面我们与其他的数据库软件是相当的。
  • 支持
    • 我们的邮件列表提供一个非常大的开发人员和用户的组以帮助解决所碰到的任何问题。我们不能保证总是能解决问题,相比之下,商用数据库软件也并不是总能够提供解决方法。 直接与开发人员、用户群、手册和源程序接触使PostgreSQL的支持比其他数据库还要好。还有一些商业性的全面技术支持,可以给提供给那些需要的人。(参阅1.7 小节)
  • 价格
    • 我们对任何用途都免费,包括商用和非商用目的。 你可以不加限制地向你的产品里加入我们的代码,除了那些我们在上面的版权声明里声明的 BSD版权之外的内容。

有三个主要方面可以提升PostgreSQL的潜能。

  • 查询方式的变化,这主要涉及修改查询方式以获取更好的性能:
    • 创建索引,包括表达式和部分索引;
    • 使用COPY语句代替多个Insert语句;
    • 将多个SQL语句组成一个事务以减少提交事务的开销;
    • 从一个索引中提取多条记录时使用CLUSTER;
    • 从一个查询结果中取出部分记录时使用LIMIT;
    • 使用预编译式查询(Prepared Query);
    • 使用ANALYZE以保持精确的优化统计;
    • 定期使用 VACUUM 或 pg_autovacuum
    • 进行大量数据更改时先删除索引(然后重建索引)
相比MySQL,PostgreSQL并没有什么刚性的缺点,但是它的纯免费特征确实是MySQL无法比拟的。它完全可以成为软件产品解决方案中非常重要的一环,特别是针对很多中低端用户,不仅在使用中不会感到任何差异,而且还能节省一部分额外的费用,这对于产品的市场推广是非常有帮助的。
将多列转成1列

在实际应用中常常遇见这样的情况,见下表,我们现在需要统计出来每年每个人的工资总和以及发放月份。

user_name year month money
张三 2011 1 900
张三 2011 2 1200
张三 2011 5 1100
张三 2011 6 1300
李四 2011 1 1100
李四 2011 3 1200

即我们要得到下面表的结果

user_name year monthes total money
张三 2011 1,2,5,6 4500
李四 2011 1,3 2300

首先我们想到的是有这样的SQL语句:
SELECT user_name,year,myfunction(month) AS monthes, SUM(money) AS total_money FROM table GROUP BY user_name,year;

像count或者sum一样吧数据表中的某个字段按照需要拼接起来,但是在PostgreSQL好像没有直接的方法来实现(或许有笔者没有发现,正因为没有发现所以笔者才研究了半天得到下面的心得)。

方法一:在PostgreSQL中如果不自定义函数直接用SQL来实现

SELECT t1.user_name, t1.year, ARRAY_TO_STRING(array(SELECT t2.month FROM table t2 WHERE t2.user_name=t1.user_name AND  t2.year=t1.year), ‘,’)  AS monthes, SUM(t1.money) AS total_money FROM table t1 WHERE 1 GROUP BY t1.user_name, t1.year;

这里主要是用了PostgreSQL的内置数组函数array_to_string把数组拼接成字符串。

PostgreSQL的ARRAY_AGG函数是用来连接到一个数组中的输入值,包括空
SELECT ARRAY_AGG(SALARY) FROM COMPANY;结果{20000,65000,85000,45000,10000}  
SELECT UNNSET(ARRAY_AGG(SALARY)) FROM COMPANY函数可将结果还原为多行情况