コード例 #1
0
ファイル: main.go プロジェクト: jlund3/ford
func main() {
	rand.Seed(time.Now().UnixNano())

	corpus := load.Newsgroups.Import()
	gold := load.Newsgroups.Label(corpus)

	mom := cluster.NewMoM(corpus, 20, .1, .01)
	checker := cluster.NewConvergenceCheck(mom.Z)
	converged := false

	var dur time.Duration
	var iter int

	fmt.Println("iter\ttime\tchanges\tf-measure\tARI\tVI")

	for !converged {
		start := time.Now()
		mom.CCM()
		end := time.Now()

		dur += end.Sub(start)
		iter += 1

		pred := eval.NewClusteringState(mom.Z)
		cont := eval.NewContingency(gold, pred)
		changes := checker.Check()

		line := []string{
			fmt.Sprintf("%d", iter),
			fmt.Sprintf("%.3f", dur.Seconds()),
			fmt.Sprintf("%d", changes),
			fmt.Sprintf("%.3f", cont.FMeasure()),
			fmt.Sprintf("%.3f", cont.ARI()),
			fmt.Sprintf("%.3f", cont.VI())}
		fmt.Println(strings.Join(line, "\t"))

		converged = changes == 0
	}

	fmt.Println()
	for z := 0; z < mom.T; z++ {
		fmt.Printf("%d: %s\n", z, mom.TopicSummary(z, 10))
	}
}
コード例 #2
0
ファイル: main.go プロジェクト: jlund3/ford
func MOM(c *pipeline.Corpus) *cluster.MoM {
	return cluster.NewMoM(c, 20, .01, .01)
}