Speed up model scoring/prediction for large datasets #10

HaydenMcT · 2024-09-05T11:03:44Z

The old classify() code calls X.values for each sample separately. Caching this operation before the loop leads to orders of magnitude speedup for an experiment we recently ran on the Adult dataset from the UCI machine learning repository.

Results in orders of magnitude speedup for large datasets

reduce number of calls to pandas.DataFrame.values

5bdd9ce

Results in orders of magnitude speedup for large datasets

HaydenMcT mentioned this pull request Oct 29, 2024

Scikit-Learn compatible rewrite #12

Merged

HaydenMcT closed this Oct 29, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Speed up model scoring/prediction for large datasets #10

Speed up model scoring/prediction for large datasets #10

HaydenMcT commented Sep 5, 2024

Speed up model scoring/prediction for large datasets #10

Speed up model scoring/prediction for large datasets #10

Conversation

HaydenMcT commented Sep 5, 2024