<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>“不周山” 的评论</title>
	<atom:link href="http://www.wentrue.net/blog/?feed=comments-rss2" rel="self" type="application/rss+xml" />
	<link>http://www.wentrue.net/blog</link>
	<description>信息自由、数据挖掘、高性能计算</description>
	<lastBuildDate>Thu, 19 Aug 2010 05:56:24 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
	<item>
		<title>bird 关于 序列模式挖掘 的评论</title>
		<link>http://www.wentrue.net/blog/?p=1016&#038;cpage=1#comment-239</link>
		<dc:creator>bird</dc:creator>
		<pubDate>Thu, 19 Aug 2010 05:56:24 +0000</pubDate>
		<guid isPermaLink="false">http://www.wentrue.net/blog/?p=1016#comment-239</guid>
		<description>靠，09年的时候就想搞这个来着
R的更新速度真是让人欢喜！！</description>
		<content:encoded><![CDATA[<p>靠，09年的时候就想搞这个来着<br />
R的更新速度真是让人欢喜！！</p>
]]></content:encoded>
	</item>
	<item>
		<title>googya 关于 序列模式挖掘 的评论</title>
		<link>http://www.wentrue.net/blog/?p=1016&#038;cpage=1#comment-238</link>
		<dc:creator>googya</dc:creator>
		<pubDate>Wed, 18 Aug 2010 12:12:01 +0000</pubDate>
		<guid isPermaLink="false">http://www.wentrue.net/blog/?p=1016#comment-238</guid>
		<description>可惜了在windows平台下还没有这个包的实现</description>
		<content:encoded><![CDATA[<p>可惜了在windows平台下还没有这个包的实现</p>
]]></content:encoded>
	</item>
	<item>
		<title>Red_Fox 关于 mongodb小结 的评论</title>
		<link>http://www.wentrue.net/blog/?p=772&#038;cpage=1#comment-236</link>
		<dc:creator>Red_Fox</dc:creator>
		<pubDate>Tue, 17 Aug 2010 21:30:45 +0000</pubDate>
		<guid isPermaLink="false">http://www.wentrue.net/blog/?p=772#comment-236</guid>
		<description>恩，是啊，实际上所有的数据库都是这样处理的，都只打上删除标记，不会做出任何更多的行为，只有待到你或计划中的发出整理碎片的指令才会去处理这些空穴，处理碎片是个耗时很长的过程，所以通常情况下是不该去处理的，一般都要等到业务停顿的时机再去处理。</description>
		<content:encoded><![CDATA[<p>恩，是啊，实际上所有的数据库都是这样处理的，都只打上删除标记，不会做出任何更多的行为，只有待到你或计划中的发出整理碎片的指令才会去处理这些空穴，处理碎片是个耗时很长的过程，所以通常情况下是不该去处理的，一般都要等到业务停顿的时机再去处理。</p>
]]></content:encoded>
	</item>
	<item>
		<title>任鸟飞 关于 follow人，还是follow内容 的评论</title>
		<link>http://www.wentrue.net/blog/?p=995&#038;cpage=1#comment-235</link>
		<dc:creator>任鸟飞</dc:creator>
		<pubDate>Tue, 17 Aug 2010 16:43:57 +0000</pubDate>
		<guid isPermaLink="false">http://www.wentrue.net/blog/?p=995#comment-235</guid>
		<description>cutt 以前还挺听说过，试试看</description>
		<content:encoded><![CDATA[<p>cutt 以前还挺听说过，试试看</p>
]]></content:encoded>
	</item>
	<item>
		<title>wentrue 关于 mongodb小结 的评论</title>
		<link>http://www.wentrue.net/blog/?p=772&#038;cpage=1#comment-234</link>
		<dc:creator>wentrue</dc:creator>
		<pubDate>Tue, 17 Aug 2010 13:16:35 +0000</pubDate>
		<guid isPermaLink="false">http://www.wentrue.net/blog/?p=772#comment-234</guid>
		<description>其中的存储逻辑应该是挺复杂的，具体怎么实现得看源代码才能有答案，估计更多的是以空间来换取解决方案的简化，因为mongodb本就以空间耗费大而著称的。另外，mongodb是以bson格式存储数据，bson格式有一个规定是每个对象不得大于4M，这个对简化逻辑应该能起到一定的作用。</description>
		<content:encoded><![CDATA[<p>其中的存储逻辑应该是挺复杂的，具体怎么实现得看源代码才能有答案，估计更多的是以空间来换取解决方案的简化，因为mongodb本就以空间耗费大而著称的。另外，mongodb是以bson格式存储数据，bson格式有一个规定是每个对象不得大于4M，这个对简化逻辑应该能起到一定的作用。</p>
]]></content:encoded>
	</item>
	<item>
		<title>Red_Fox 关于 mongodb小结 的评论</title>
		<link>http://www.wentrue.net/blog/?p=772&#038;cpage=1#comment-233</link>
		<dc:creator>Red_Fox</dc:creator>
		<pubDate>Tue, 17 Aug 2010 10:54:02 +0000</pubDate>
		<guid isPermaLink="false">http://www.wentrue.net/blog/?p=772#comment-233</guid>
		<description>不了解这个数据库，但对楼上的说的那个问题有个人的看法，线性空间中的空穴是不能轻易的被消除的，因为这意味着你得挪动数据，由于空穴的大小往往是不确定的（比如原来你存放的是一篇文章）挪动数据会非常麻烦，所以一般都会待到空间开始碎片化了再重新组织数据。
“挪动数据会非常麻烦”如果你非要挪动不可，那么得进行多次比较，一个1k的空穴空间，你只移动了100字节的数据过去，还有900多字节的空穴存在，你还得继续填补，为了有效的填补，你得筛选出最接近大小的1条完整的数据来填充，而另一种极端情况是，许多空出的空穴虽然比较大，但小于现有的任一条数据所占用的空间，那么这些空穴你就没法进行填补了（得解释的是，如果这个数据库的某种数据结构是设计为具有多段存储能力的另当别论）。不管怎样，快速的手段有极大的几率会留下很多空穴，而且还会打乱数据的排列，增加文件读取时所花费的时间，所以，还有1种方式，就是整体重写一次，这样就可以完全无碎片，但这种方法太耗时了。</description>
		<content:encoded><![CDATA[<p>不了解这个数据库，但对楼上的说的那个问题有个人的看法，线性空间中的空穴是不能轻易的被消除的，因为这意味着你得挪动数据，由于空穴的大小往往是不确定的（比如原来你存放的是一篇文章）挪动数据会非常麻烦，所以一般都会待到空间开始碎片化了再重新组织数据。<br />
“挪动数据会非常麻烦”如果你非要挪动不可，那么得进行多次比较，一个1k的空穴空间，你只移动了100字节的数据过去，还有900多字节的空穴存在，你还得继续填补，为了有效的填补，你得筛选出最接近大小的1条完整的数据来填充，而另一种极端情况是，许多空出的空穴虽然比较大，但小于现有的任一条数据所占用的空间，那么这些空穴你就没法进行填补了（得解释的是，如果这个数据库的某种数据结构是设计为具有多段存储能力的另当别论）。不管怎样，快速的手段有极大的几率会留下很多空穴，而且还会打乱数据的排列，增加文件读取时所花费的时间，所以，还有1种方式，就是整体重写一次，这样就可以完全无碎片，但这种方法太耗时了。</p>
]]></content:encoded>
	</item>
	<item>
		<title>wentrue 关于 mongodb小结 的评论</title>
		<link>http://www.wentrue.net/blog/?p=772&#038;cpage=1#comment-231</link>
		<dc:creator>wentrue</dc:creator>
		<pubDate>Sun, 15 Aug 2010 01:58:10 +0000</pubDate>
		<guid isPermaLink="false">http://www.wentrue.net/blog/?p=772#comment-231</guid>
		<description>这个是很好理解的，很多存储引擎都会这么干。这些说明来自于官方文档，除非以后版本升级带来的改变，否则没有问题。删除的空间还会重复利用的，不是空置。也可以通过mongodb提供的管理命令来回收碎片。</description>
		<content:encoded><![CDATA[<p>这个是很好理解的，很多存储引擎都会这么干。这些说明来自于官方文档，除非以后版本升级带来的改变，否则没有问题。删除的空间还会重复利用的，不是空置。也可以通过mongodb提供的管理命令来回收碎片。</p>
]]></content:encoded>
	</item>
	<item>
		<title>hwang 关于 mongodb小结 的评论</title>
		<link>http://www.wentrue.net/blog/?p=772&#038;cpage=1#comment-230</link>
		<dc:creator>hwang</dc:creator>
		<pubDate>Sat, 14 Aug 2010 16:54:57 +0000</pubDate>
		<guid isPermaLink="false">http://www.wentrue.net/blog/?p=772#comment-230</guid>
		<description>3、删除记录不释放空间：这很容易理解，为避免记录删除后的数据的大规模挪动，原记录空间不删除，只标记“已删除”即可，以后还可以重复利用。

请问一下这段话作者进行考证了吗？如果删除记录时不释放空间的话，那么何时释放呢？总不能一直增长吧</description>
		<content:encoded><![CDATA[<p>3、删除记录不释放空间：这很容易理解，为避免记录删除后的数据的大规模挪动，原记录空间不删除，只标记“已删除”即可，以后还可以重复利用。</p>
<p>请问一下这段话作者进行考证了吗？如果删除记录时不释放空间的话，那么何时释放呢？总不能一直增长吧</p>
]]></content:encoded>
	</item>
	<item>
		<title>googya 关于 与你同行 的评论</title>
		<link>http://www.wentrue.net/blog/?p=1008&#038;cpage=1#comment-229</link>
		<dc:creator>googya</dc:creator>
		<pubDate>Sat, 14 Aug 2010 10:42:17 +0000</pubDate>
		<guid isPermaLink="false">http://www.wentrue.net/blog/?p=1008#comment-229</guid>
		<description>性情中人啊</description>
		<content:encoded><![CDATA[<p>性情中人啊</p>
]]></content:encoded>
	</item>
	<item>
		<title>alex 关于 mongodb小结 的评论</title>
		<link>http://www.wentrue.net/blog/?p=772&#038;cpage=1#comment-228</link>
		<dc:creator>alex</dc:creator>
		<pubDate>Thu, 12 Aug 2010 01:08:31 +0000</pubDate>
		<guid isPermaLink="false">http://www.wentrue.net/blog/?p=772#comment-228</guid>
		<description>分析的很好</description>
		<content:encoded><![CDATA[<p>分析的很好</p>
]]></content:encoded>
	</item>
</channel>
</rss>
