抱抱脸空间托管的 Docker 的端口为什么访问不了

mikeee · 2024 年6 月 14 日 11:36

app.py

# pylint: disable=line-too-long, missing-module-docstring, missing-function-docstring,broad-exception-caught, too-many-statements

import json
import os
import re
import time
from datetime import datetime, timedelta
from textwrap import dedent

import requests

# from bs4 import BeautifulSoup
from flask import Flask, Response, request, stream_with_context
from loguru import logger
from ycecream import y

y.configure(sln=1)

app = Flask(__name__)

APP_SESSION_VALIDITY = timedelta(days=3)
ACCESS_TOKEN_VALIDITY = timedelta(hours=1)
USERNAME = os.environ.get("USERNAME", "")
PASSWORD = os.environ.get("PASSWORD", "")
AUTHKEY = os.environ.get("AUTHKEY", "")

_ = "Set USERNAME and PASSWORD somewhere (e.g., set/export or secrets in hf space, or you wont be able to fetch sfuff from reka.ai"
assert USERNAME and PASSWORD, _

y(USERNAME[:3], PASSWORD[:2], AUTHKEY[:2])

cache = {
    "app_session": None,
    "app_session_time": None,
    "access_token": None,
    "access_token_time": None,
}

y(cache)

# 配置日志记录
# logging.basicConfig(level=logging.DEBUG)


def fetch_tokens():
    session = requests.Session()

    # 检查并获取 appSession
    if (
        not cache["app_session_time"]
        or datetime.now() - cache["app_session_time"] >= APP_SESSION_VALIDITY
    ):
        logger.info("Fetching new appSession")
        login_page_response = session.get(
            "https://chat.reka.ai/bff/auth/login", allow_redirects=True
        )
        if login_page_response.status_code != 200:
            logger.error("Failed to load login page")
            return None

        # soup = BeautifulSoup(login_page_response.text, "html.parser")
        # state_value = soup.find("input", {"name": "state"})["value"]

        state_value = ""
        _ = re.search(r"\w{20,}", login_page_response.text)
        if _:
            state_value = _.group()

        session.post(
            "https://auth.reka.ai/u/login",
            data={
                "state": state_value,
                "username": USERNAME,
                "password": PASSWORD,
                "action": "default",
            },
        )
        cache["app_session"] = session.cookies.get("appSession")
        cache["app_session_time"] = datetime.now()  # type: ignore

    # 检查并获取 accessToken
    if (
        not cache["access_token_time"]
        or datetime.now() - cache["access_token_time"] >= ACCESS_TOKEN_VALIDITY
    ):
        logger.info("Fetching new accessToken")
        response = session.get(
            "https://chat.reka.ai/bff/auth/access_token",
            headers={"Cookie": f'appSession={cache["app_session"]}'},
        )
        if response.status_code != 200:
            logger.error("Failed to get access token")
            return None
        cache["access_token"] = response.json().get("accessToken")
        cache["access_token_time"] = datetime.now()  # type: ignore

    y(cache)

    return cache["access_token"]


@app.route("/")
def landing():
    return dedent(
        """
        query /hf/v1/chat/completions for a spin, e.g. curl -XPOST 127.0.0.1:7860/hf/v1/chat/completions -H "Authorization: Bearer Your_AUTHKEY"

        or hf-space-url e.g.,
        curl -XPOST https://mikeee-reka.hf.space/hf/v1/chat/completions -H "Authorization: Bearer Your_AUTHKEY"  -H "Content-Type: application/json" --data "{\"model\": \"reka-core\", \"messages\": [{\"role\": \"user\", \"content\": \"Say this is a test!\"}]}"
        """
    )


@app.route("/hf/v1/chat/completions", methods=["POST", "OPTIONS"])
def chat_completions():
    if request.method == "OPTIONS":
        return Response(
            "",
            status=204,
            headers={
                "Access-Control-Allow-Origin": "*",
                "Access-Control-Allow-Headers": "*",
            },
        )

    if (
        request.method != "POST"
        or request.path != "/hf/v1/chat/completions"
        or request.headers.get("Authorization") != f"Bearer {AUTHKEY}"
    ):
        logger.error("Unauthorized access attempt")
        return Response("Unauthorized", status=401)

    access_token = fetch_tokens()
    if not access_token:
        logger.error("Failed to obtain access token")
        return Response("Failed to obtain access token.", status=500)

    try:
        request_body = request.json
    except Exception as e:
        logger.error(f"Error parsing JSON body: {e}")
        return Response("Error parsing JSON body", status=400)

    messages = request_body.get("messages", [])  # type: ignore
    model = request_body.get("model", "reka-core")  # type: ignore

    conversation_history = [
        {
            "type": "human" if msg["role"] in ["user", "system"] else "model",
            "text": msg["content"],
        }
        for msg in messages
    ]

    if conversation_history and conversation_history[0]["type"] != "human":
        conversation_history.insert(0, {"type": "human", "text": ""})
    if conversation_history and conversation_history[-1]["type"] != "human":
        conversation_history.append({"type": "human", "text": ""})

    i = 0
    while i < len(conversation_history) - 1:
        if conversation_history[i]["type"] == conversation_history[i + 1]["type"]:
            conversation_history.insert(
                i + 1,
                {
                    "type": "model"
                    if conversation_history[i]["type"] == "human"
                    else "human",
                    "text": "",
                },
            )
        i += 1

    new_request_body = {
        "conversation_history": conversation_history,
        "stream": True,
        "use_search_engine": False,
        "use_code_interpreter": False,
        "model_name": "reka-core",
        "random_seed": int(time.time()),
    }

    response = requests.post(
        "https://chat.reka.ai/api/chat",
        headers={
            "authorization": f"bearer {access_token}",
            "content-type": "application/json",
        },
        data=json.dumps(new_request_body),
        stream=True,
        timeout=600,  # timeout 10 min.
    )

    if response.status_code != 200:
        logger.error(f"Error from external API: {response.status_code} {response.text}")
        return Response(response.text, status=response.status_code)

    created = int(time.time())

    def generate_stream():
        decoder = json.JSONDecoder()
        encoder = json.JSONEncoder()
        content_buffer = ""
        full_content = ""
        prev_content = ""
        last_four_texts = []

        for line in response.iter_lines():
            if line:
                content_buffer += line.decode("utf-8") + "\n"
                while "\n" in content_buffer:
                    newline_index = content_buffer.index("\n")
                    line = content_buffer[:newline_index]
                    content_buffer = content_buffer[newline_index + 1 :]

                    if not line.startswith("data:"):
                        continue

                    try:
                        data = decoder.decode(line[5:])
                    except json.JSONDecodeError:
                        continue

                    last_four_texts.append(data["text"])
                    if len(last_four_texts) > 4:
                        last_four_texts.pop(0)

                    if len(last_four_texts) == 4 and (
                        len(last_four_texts[3]) < len(last_four_texts[2])
                        or last_four_texts[3].endswith("<sep")
                        or last_four_texts[3].endswith("<")
                    ):
                        break

                    full_content = data["text"]
                    new_content = full_content[len(prev_content) :]
                    prev_content = full_content

                    formatted_data = {
                        "id": "chatcmpl-"
                        + "".join([str(time.time()), str(hash(new_content))]),
                        "object": "chat.completion.chunk",
                        "created": created,
                        "model": model,
                        "choices": [
                            {
                                "index": 0,
                                "delta": {"content": new_content},
                                "finish_reason": None,
                            }
                        ],
                    }
                    yield f"data: {encoder.encode(formatted_data)}\n\n"

        done_data = {
            "id": "chatcmpl-" + "".join([str(time.time()), str(hash("done"))]),
            "object": "chat.completion.chunk",
            "created": created,
            "model": model,
            "choices": [{"index": 0, "delta": {}, "finish_reason": "stop"}],
        }
        yield f"data: {json.dumps(done_data)}\n\n"
        yield "data: [DONE]\n\n"

    return Response(
        stream_with_context(generate_stream()),
        headers={"Content-Type": "text/event-stream"},
    )


if __name__ == "__main__":
    app.run(host="0.0.0.0", port=7860)

这个薅 reka 的 python 程序（抄某个大佬的）在本地运行没有问题。我把它放到抱抱脸空间 reka - a Hugging Face Space by mikeee 。但

curl -XPOST https://mikeee-reka.hf.space/hf/v1/chat/completions

却连不上，说 Sorry, we can’t find the page you are looking for. 但另一个空间几乎相同的设置访问没有问题：

curl -XPOST  https://mikeee-baai-m3.hf.space/embed/

# 输出
# {"detail":[{"type":"missing","loc":["body"],"msg":"Field required","input":null,"url":"https://errors.pydantic.dev/2.6/v/missing"}]}

不知道有没有佬知道是啥原因

GordonChanFZ · 2024 年6 月 14 日 11:39

空间得public

czt10086 · 2024 年6 月 14 日 12:15

佬们求点赞

mikeee · 2024 年6 月 14 日 12:28

有道理，我试试。

mikeee · 2024 年6 月 14 日 12:43

 curl -XPOST https://mikeee-reka.hf.space/hf/v1/chat/completions -H "Authorization: Bearer 316287378"  -H "Content-Type: application/json" --data "{\"model\": \"reka-core\", \"messages\": [{\"role\": \"user\", \"content\": \"Say this is a test!\"}]}"

喔趣，成了，顺便暴露AUTHKEY 316287378 送给有兴趣的网友用用—— 不过是流式的，聊天可以直接用，用作翻译要多处理一步。

bbb · 2024 年6 月 14 日 12:48

感谢分享

handsome · 2024 年6 月 14 日 13:14

你的抱脸不屏蔽v1吗

mikeee · 2024 年6 月 14 日 13:18

薅上面 reka 的 new-api 设置（one-api应该差不多）

模型：reka-core,reka-edge,reka-flash
密钥：316287378
代理：https://mikeee-reka.hf.space/hf/

仪表板测试说无效，但上面显示用 curl 测试确实可以用。也用python测过可用。

有兴趣的网友可以在抱抱脸空间（全部免费，只要一个电邮地址注册，但需提子才能访问抱抱脸空间）复制上面我的的抱抱脸空间 reka - a Hugging Face Space by mikeee ，再在空间secrets填上reka的用户名和密码和 AUTHKEY 就可以开薅了！可能的话AUTHKEY发给我共享一下。

eggacheb · 2024 年6 月 14 日 13:19

他改后缀了/hf/v1

mikeee · 2024 年6 月 14 日 13:21

app.py 原型抄某大佬的，文件里面有 repo 地址。hf 应该也可以去掉。不会 flask，倒是想改成用 fastapi。

handsome · 2024 年6 月 14 日 13:24

我还以为路径有v1就屏蔽。。

eggacheb · 2024 年6 月 14 日 13:26

oneapi也可以这样改，但是我不会（）

handsome · 2024 年6 月 14 日 13:26

这个可以会

Coker · 2024 年6 月 14 日 14:18

感谢分享
有点眼熟，原来我也搞过……
https://linux.do/t/topic/91209/36?u=coker

mikeee · 2024 年6 月 14 日 14:39

其实原来我就是复制大佬的空间，一开始没设成公开空间所以访问不了，纳闷了半天

Coker · 2024 年6 月 14 日 14:45

主要是reno佬的代码

mistpeak · 2024 年6 月 14 日 17:51

容易改过头，我上回就是，改完openai渠道的反而不能用了，但是别的可以

neo · 2024 年8 月 29 日 04:51

From 快问快答 to 开发调优

话题		回复	浏览量
（目前（1112）回归正常）一键复制抱抱脸空间之duck2api 资源荟萃	24	999	2025 年1 月 2 日
【待修】一键复制抱抱脸空间薅 deepseek-chat 资源荟萃人工智能	20	1791	2024 年12 月 14 日
在Hugging Face上搭建Uptime kuma并接入数据库资源荟萃 uptime-kuma	29	1597	2025 年1 月 21 日
分享一个可在抱脸空间自建的高精度IP查询接口，可用于Workers安全反代！开发调优 Cloudflare , HuggingFace , 网络安全	54	3024	2025 年1 月 15 日
过滤掉deepseek-r1 api的多余参数，并输出思考内容搞七捻三 DeepSeek , 纯水	73	1117	2025 年1 月 23 日

抱抱脸空间托管的 Docker 的端口为什么访问不了

相关话题