golangLAKEHOUSE/internal/vectord/batch_bench_test.go

package vectord

import (
	"fmt"
	"math/rand"
	"testing"
)

// BenchmarkSingleAdd vs BenchmarkBatchAdd quantifies the lock-amortization
// win for the HTTP-batch shape. Same N items, same vectors; one path
// takes the lock N times, the other takes it once. Run with:
//   go test ./internal/vectord/ -bench=. -benchmem -benchtime=1x
func BenchmarkSingleAdd(b *testing.B) {
	for _, n := range []int{16, 128, 1024} {
		b.Run(fmt.Sprintf("N=%d", n), func(b *testing.B) {
			items := makeBatch(n, 768)
			for i := 0; i < b.N; i++ {
				idx := mustIndex(b)
				for _, it := range items {
					if err := idx.Add(it.ID, it.Vector, it.Metadata); err != nil {
						b.Fatalf("Add: %v", err)
					}
				}
			}
		})
	}
}

func BenchmarkBatchAdd(b *testing.B) {
	for _, n := range []int{16, 128, 1024} {
		b.Run(fmt.Sprintf("N=%d", n), func(b *testing.B) {
			items := makeBatch(n, 768)
			for i := 0; i < b.N; i++ {
				idx := mustIndex(b)
				if err := idx.BatchAdd(items); err != nil {
					b.Fatalf("BatchAdd: %v", err)
				}
			}
		})
	}
}

func mustIndex(tb testing.TB) *Index {
	tb.Helper()
	idx, err := NewIndex(IndexParams{
		Name:      "bench",
		Dimension: 768,
		M:         DefaultM,
		EfSearch:  DefaultEfSearch,
		Distance:  DistanceCosine,
	})
	if err != nil {
		tb.Fatalf("NewIndex: %v", err)
	}
	return idx
}

func makeBatch(n, dim int) []BatchItem {
	rng := rand.New(rand.NewSource(int64(n)))
	out := make([]BatchItem, n)
	for i := range out {
		v := make([]float32, dim)
		for j := range v {
			v[j] = rng.Float32()*2 - 1
		}
		out[i] = BatchItem{ID: fmt.Sprintf("k-%06d", i), Vector: v}
	}
	return out
}