[go]Go 中 LevelDB 数据库大小缩减的问题 (levigo)

· 收录于 2024-01-06 02:27:08 · source URL

问题详情

Hello Stack Overflow 社区,

我目前正在开发一个 Go 程序,该程序使用 levigo 包利用 LevelDB 进行数据存储。我的目标是有效地管理数据库大小,尤其是在可用存储空间不足时删除旧记录。但是,我观察到一个意外的行为:删除记录后,LevelDB 数据库文件夹大小不会按比例减小。

下面是重现该问题的代码的简化版本:

保存数据代码:

package main

import (
    "crypto/rand"
    "fmt"
    "log"

    "github.com/jmhodges/levigo"
)

func main() {
    // Specify the LevelDB options
    options := levigo.NewOptions()
    cache := levigo.NewLRUCache(5 << 20)
    options.SetCache(cache)
    options.SetCreateIfMissing(true)
    options.SetMaxOpenFiles(100)

    // Open or create the LevelDB database
    db, _ := levigo.Open("/tmp/mydatabase", options)
    defer db.Close()

    dataSize := 1024 * 1024 * 5 // 5MB
    randomData := make([]byte, dataSize)
    rand.Read(randomData)

    // Enqueue 5 pieces of data
    for i := 1; i <= 5; i++ {
        key := []byte(fmt.Sprintf("key%d", i))

        // Write the batch to the database
        if err := db.Put(levigo.NewWriteOptions(), key, randomData); err != nil {
            log.Fatal(err)
        }

        fmt.Printf("Enqueued: %s \n", key)
    }

    fmt.Println("Enqueue completed.")
}

删除数据代码:

package main

import (
    "fmt"
    "log"

    "github.com/jmhodges/levigo"
)

func main() {
    // Specify the LevelDB options
    options := levigo.NewOptions()
    cache := levigo.NewLRUCache(5 << 20)
    options.SetCache(cache)
    options.SetCreateIfMissing(true)
    options.SetMaxOpenFiles(100)

    // Open or create the LevelDB database
    db, _ := levigo.Open("/tmp/mydatabase", options)
    defer db.Close()

    // Dequeue (remove) the 3 pieces of data
    for i := 1; i <= 3; i++ {
        key := []byte(fmt.Sprintf("key%d", i))

        // Create a WriteOptions for deleting from the database
        wo := levigo.NewWriteOptions()
        defer wo.Close()

        // Delete the key from the database
        if err := db.Delete(wo, key); err != nil {
            log.Fatal(err)
        }

        fmt.Printf("Dequeued: %s\n", key)
    }

    fmt.Println("Dequeue completed.")
}

运行代码保存 5 个项目后,数据库文件夹大小为 30MB。随后,当我运行代码删除 3 个项目时,文件夹大小减少到 26MB。考虑到删除的数据量,我预计大小会更显着地减少。

我已经设置了 LevelDB 选项,例如缓存大小和文件限制,但似乎我可能在配置或删除过程中遗漏了一些东西。

问题:

  1. 什么原因可能导致 LevelDB 数据库文件夹大小在删除记录后没有按比例减小?
  2. 我是否应该考虑其他配置或优化来更有效地管理数据库大小?
  3. levigo 中是否有特定的方法来压缩数据库以释放未使用的空间?

有关解决此问题的任何见解或指导将不胜感激。谢谢!

最佳回答

通过阅读此 issue on level DB repo 我意识到我可以在删除循环 db 的末尾添加这一行。CompactRange(levigo.范围{})
因此,数据库将删除未使用的数据,并且数据库文件夹的总大小会根据它而减小。