acompress_documents() — langchain Function Reference

Architecture documentation for the acompress_documents() function in embeddings_filter.py from the langchain codebase.

Function python LangChainCore MessageInterface

Entity Profile

LangChainCore→ MessageInterface→ acompress_documents() — langchain Function Reference

Dependency Diagram

graph TD
  35e9f310_53c6_44f0_0e88_a84cd20d72b6["acompress_documents()"]
  7a0a1fba_1d80_811c_4eea_2a0bc8f55ee6["EmbeddingsFilter"]
  35e9f310_53c6_44f0_0e88_a84cd20d72b6 -->|defined in| 7a0a1fba_1d80_811c_4eea_2a0bc8f55ee6
  style 35e9f310_53c6_44f0_0e88_a84cd20d72b6 fill:#6366f1,stroke:#818cf8,color:#fff

Relationship Graph

Source Code

libs/langchain/langchain_classic/retrievers/document_compressors/embeddings_filter.py lines 100–141

    async def acompress_documents(
        self,
        documents: Sequence[Document],
        query: str,
        callbacks: Callbacks | None = None,
    ) -> Sequence[Document]:
        """Filter documents based on similarity of their embeddings to the query."""
        try:
            from langchain_community.document_transformers.embeddings_redundant_filter import (  # noqa: E501
                _aget_embeddings_from_stateful_docs,
                get_stateful_documents,
            )
        except ImportError as e:
            msg = (
                "To use please install langchain-community "
                "with `pip install langchain-community`."
            )
            raise ImportError(msg) from e

        try:
            import numpy as np
        except ImportError as e:
            msg = "Could not import numpy, please install with `pip install numpy`."
            raise ImportError(msg) from e
        stateful_documents = get_stateful_documents(documents)
        embedded_documents = await _aget_embeddings_from_stateful_docs(
            self.embeddings,
            stateful_documents,
        )
        embedded_query = await self.embeddings.aembed_query(query)
        similarity = self.similarity_fn([embedded_query], embedded_documents)[0]
        included_idxs: np.ndarray = np.arange(len(embedded_documents))
        if self.k is not None:
            included_idxs = np.argsort(similarity)[::-1][: self.k]
        if self.similarity_threshold is not None:
            similar_enough = np.where(
                similarity[included_idxs] > self.similarity_threshold,
            )
            included_idxs = included_idxs[similar_enough]
        for i in included_idxs:
            stateful_documents[i].state["query_similarity_score"] = similarity[i]
        return [stateful_documents[i] for i in included_idxs]

Domain

LangChainCore

Subdomains

MessageInterface

Defined In

libs/langchain/langchain_classic/retrievers/document_compressors/embeddings_filter.py

Source

View on GitHub

Frequently Asked Questions

What does acompress_documents() do?

acompress_documents() is a function in the langchain codebase, defined in libs/langchain/langchain_classic/retrievers/document_compressors/embeddings_filter.py.

Where is acompress_documents() defined?

acompress_documents() is defined in libs/langchain/langchain_classic/retrievers/document_compressors/embeddings_filter.py at line 100.

Analyze Your Own Codebase

Get architecture documentation, dependency graphs, and domain analysis for your codebase in minutes.

Try Supermodel Free