imageutils

package
v1.4.4-alpha1202-diff-... Latest Latest
Warning

This package is not in the latest version of its module.

Go to latest
Published: Dec 2, 2025 License: AGPL-3.0 Imports: 25 Imported by: 0

Documentation

Index

Constants

This section is empty.

Variables

View Source
var Exports = map[string]any{
	"ExtractImage":         ExtractImage,
	"ExtractImageFromFile": ExtractImageFromFile,

	"context": WithCtx,
}

Functions

func ExtractDocumentPagesContext

func ExtractDocumentPagesContext(ctx context.Context, input string) (chan *ImageResult, error)

func ExtractImage

func ExtractImage(i any) chan *ImageResult

ExtractImage extracts images from various input types, such as io.Reader, []byte, or string.

func ExtractImageFromFile

func ExtractImageFromFile(filePath string, options ...ImageExtractorOption) (chan *ImageResult, error)

ExtractImageFromFile extract images from a file path, we can handle some video formats, PDF, and other files that may contain images.

func ExtractVideoFrameContext

func ExtractVideoFrameContext(ctx context.Context, input string) (chan *ImageResult, error)

func ExtractWildStringImage

func ExtractWildStringImage(i any) chan *ImageResult

ExtractWildStringImage 是一个强大的、多策略的图片提取器,它能从任意输入(字符串、字节切片等)中地毯式搜索并解析出图片。

此函数的核心设计思想是“鲁棒性优先”,它会自动尝试用多种方法识别和解码可能隐藏在各种格式中的图片数据。 函数异步执行,并返回一个通道(channel),所有找到的图片结果都会通过这个通道传出。 为了效率,内部通过SHA256哈希对图片进行去重,确保同一张图片只会被发送一次。

提取过程按以下优先级顺序执行:

  1. 首先,直接检测输入本身是否为完整的、原始的图片二进制数据(如PNG, JPEG文件内容)。
  2. 若不是,则检查输入是否为一个完整的Base64字符串,并尝试解码。
  3. 接着,将输入尝试作为JSON解析,并递归地在所有JSON值中寻找Base64编码的图片。
  4. 然后,在整个输入中扫描符合 "",
		"attachments": [
			{
				"type": "file",
				"data": "R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7"
			}
		]
	}
	`

	imageChannel := imageutils.ExtractWildStringImage(complexInput)

	fmt.Println("Found the following images:")
	for img := range imageChannel {
		// img.ShortString() 会返回一个data URI格式的缩略字符串
		fmt.Printf("- MIME: %s, Size: %d bytes, SHA256: %s\n", img.MIMEType, len(img.RawImage), img.Sha256())
		// fmt.Println(img.ImageURL()) // 可以获取完整的Data URI
	}
}

@param i any - 任何可以被转为字符串的输入,如 string, []byte 等。 @return chan *ImageResult - 一个用于接收图片结果的通道,当所有搜索完成后该通道会被关闭。

func GetImageDimensionFromFile

func GetImageDimensionFromFile(path string) (int, int, error)

GetImageDimensionFromFile return image width and height

Types

type ImageExtractorConfig

type ImageExtractorConfig struct {
	// contains filtered or unexported fields
}

type ImageExtractorOption

type ImageExtractorOption func(*ImageExtractorConfig)

func WithCtx

type ImageResult

type ImageResult struct {
	MIMEType *mimetype.MIME
	RawImage []byte
}

func (*ImageResult) Base64

func (i *ImageResult) Base64() string

func (*ImageResult) ImageURL

func (i *ImageResult) ImageURL() string

func (*ImageResult) SaveToFile

func (i *ImageResult) SaveToFile() (string, error)

func (*ImageResult) Sha256

func (i *ImageResult) Sha256() string

func (*ImageResult) ShortString

func (i *ImageResult) ShortString() string

func (*ImageResult) String

func (i *ImageResult) String() string

Jump to

Keyboard shortcuts

? : This menu
/ : Search site
f or F : Jump to
y or Y : Canonical URL