[go]Go 中 LevelDB 数据库大小缩减的问题 (levigo)
· 收录于 2024-01-06 02:27:08 · source URL
问题详情
Hello Stack Overflow 社区,
我目前正在开发一个 Go 程序,该程序使用 levigo 包利用 LevelDB 进行数据存储。我的目标是有效地管理数据库大小,尤其是在可用存储空间不足时删除旧记录。但是,我观察到一个意外的行为:删除记录后,LevelDB 数据库文件夹大小不会按比例减小。
下面是重现该问题的代码的简化版本:
保存数据代码:
package main
import (
"crypto/rand"
"fmt"
"log"
"github.com/jmhodges/levigo"
)
func main() {
// Specify the LevelDB options
options := levigo.NewOptions()
cache := levigo.NewLRUCache(5 << 20)
options.SetCache(cache)
options.SetCreateIfMissing(true)
options.SetMaxOpenFiles(100)
// Open or create the LevelDB database
db, _ := levigo.Open("/tmp/mydatabase", options)
defer db.Close()
dataSize := 1024 * 1024 * 5 // 5MB
randomData := make([]byte, dataSize)
rand.Read(randomData)
// Enqueue 5 pieces of data
for i := 1; i <= 5; i++ {
key := []byte(fmt.Sprintf("key%d", i))
// Write the batch to the database
if err := db.Put(levigo.NewWriteOptions(), key, randomData); err != nil {
log.Fatal(err)
}
fmt.Printf("Enqueued: %s \n", key)
}
fmt.Println("Enqueue completed.")
}
删除数据代码:
package main
import (
"fmt"
"log"
"github.com/jmhodges/levigo"
)
func main() {
// Specify the LevelDB options
options := levigo.NewOptions()
cache := levigo.NewLRUCache(5 << 20)
options.SetCache(cache)
options.SetCreateIfMissing(true)
options.SetMaxOpenFiles(100)
// Open or create the LevelDB database
db, _ := levigo.Open("/tmp/mydatabase", options)
defer db.Close()
// Dequeue (remove) the 3 pieces of data
for i := 1; i <= 3; i++ {
key := []byte(fmt.Sprintf("key%d", i))
// Create a WriteOptions for deleting from the database
wo := levigo.NewWriteOptions()
defer wo.Close()
// Delete the key from the database
if err := db.Delete(wo, key); err != nil {
log.Fatal(err)
}
fmt.Printf("Dequeued: %s\n", key)
}
fmt.Println("Dequeue completed.")
}
运行代码保存 5 个项目后,数据库文件夹大小为 30MB。随后,当我运行代码删除 3 个项目时,文件夹大小减少到 26MB。考虑到删除的数据量,我预计大小会更显着地减少。
我已经设置了 LevelDB 选项,例如缓存大小和文件限制,但似乎我可能在配置或删除过程中遗漏了一些东西。
问题:
- 什么原因可能导致 LevelDB 数据库文件夹大小在删除记录后没有按比例减小?
- 我是否应该考虑其他配置或优化来更有效地管理数据库大小?
- levigo 中是否有特定的方法来压缩数据库以释放未使用的空间?
有关解决此问题的任何见解或指导将不胜感激。谢谢!
最佳回答
通过阅读此 issue on level DB repo 我意识到我可以在删除循环 db 的末尾添加这一行。CompactRange(levigo.范围{})
因此,数据库将删除未使用的数据,并且数据库文件夹的总大小会根据它而减小。