Merge c041ea1b56 into 2b3b3d83ab

4 months ago · b4fa0b49ad
parent 2b3b3d83ab c041ea1b56
commit b4fa0b49ad
1 changed files with 15 additions and 7 deletions
--- a/mitmproxy2swagger/mitmproxy_capture_reader.py
+++ b/mitmproxy2swagger/mitmproxy_capture_reader.py
@ -9,6 +9,20 @@ from mitmproxy import io as iom
 from mitmproxy.exceptions import FlowReadException
 def has_non_printable_sampled(file_path: str, sample_size=2048, samples=3) -> bool:
    file_size = os.path.getsize(file_path)
    chunk_offsets = [int(file_size * i / samples) for i in range(samples)]
    with open(file_path, "rb") as f:
        for offset in chunk_offsets:
            f.seek(offset)
            data = f.read(sample_size)
            text = data.decode("utf-8", "ignore").replace("\r", "").replace("\n", "")
            if not text.isprintable():
                return True
    return False
 def mitmproxy_dump_file_huristic(file_path: str) -> int:
    val = 0
    if "flow" in file_path:
@ -19,13 +33,7 @@ def mitmproxy_dump_file_huristic(file_path: str) -> int:
    with open(file_path, "rb") as f:
        data = f.read(2048)
        # if file contains non-ascii characters after remove EOL characters
-        if (
+        if has_non_printable_sampled(file_path):
            data.decode("utf-8", "ignore")
            .replace("\r", "")
            .replace("\n", "")
            .isprintable()
            is False
        ):
            val += 50
        # if first character of the byte array is a digit
        if data[0:1].decode("utf-8", "ignore").isdigit() is True: