Tag: 3B parameter model inference optimization